Отображение данных - представление данных в форме, удобной для человека. Это вывод на печать, графические изображения (иллюстрации, графики, диаграммы и т.д.), звук и т.д.
Обработка данных - процессы, в результате которых на основе ранее накопленных данных формируются новые виды данных - обобщающие, аналитические, рекомендательные, прогнозные и т.д. Эти данные вторичной обработки могут быть подвергнуты следующей обработке и принести более глубокие, точные обобщения.
Накопление и систематизация данных, т.е. организация такого размещения данных, которое обеспечило бы быстрый поиск и отбор нужных сведений, методическое обновление данных, защиту от искажений и т.д.
Формирование первичных данных - первичные сообщения о хозяйственных операциях, документы, содержащие нормативные и юридические акты, результаты экспериментов, например, параметры новой модели самолета или автомобиля и т.д.
Понятие информации. Виды существования информации. Способы передачи информации. Единицы измерения количества информации. Свойства информации.
Слово информация произошло от латинского слова informatio, что означает разъяснение, изложение.
Информация - это отображение реального мира с помощью сведений (сообщений).
Сообщение - это форма представления информации в виде текста, речи, изображений, цифровых данных, графиков, таблиц и т.д.
Можно сказать, что информация - это сведения об объектах и явлениях окружающей среды. Например, экономическая информация - это совокупность сведений, отражающих социально-экономические процессы, таможенная информация - это совокупность сведений, отражающих таможенную политику (таможенный контроль и регулирование товарообмена) на таможенной территории Респпублики Беларусь, правовая информация - это совокупность сведений, отражающих социально-правовые процессы и т.д.
Наряду с термином "информация" в информатике используется понятие "данные". Это понятие уже, чем информация, т.к. представляет отрывочные, не связанные между собой сведения. Однако в работе с компьютерными программами чаще употребляется термин "данные".
В технологическом процессе обработки данных можно выделить 4 этапа:
Сообщения, формируемые на первом этапе, могут иметь разный вид: обычный бумажный документ, звук, видео, числовые данные на каком-то носителе. Как правило, носители первичной информации (физические носители, полученные от аналоговых устройств) - бумага, пластинки, кассеты, видеокассеты очень недолговечны. Компьютерные технологии предлагают принципиально новый подход - цифровое (дискретное) представление информации на магнитных и лазерных носителях. Посредством технических и программных средств ЭВМ первичные данные преобразуются в машинный код.
Данные характеризуются своим типом и множеством операций над ними. Данные в компьютере условно делятся на простые и сложные.
Примеры простых данных, которые может обрабатывать компьютер:
К сложным данным относятся: массивы и списки (однотипные), структуры, записи, таблицы (разнотипные).
Система счисления - это способ наименования и изображения чисел с помощью символов, имеющих определенные количественные значения.
В зависимости от способа изображения чисел системы делятся на позиционные и непозиционные.
В позиционных системах количественное значение каждой цифры зависит от места (позиции) в числе. В непозиционных системах цифры не меняют своего количественного значения при изменении их расположения в числе. Примеры, позиционная система - арабская десятичная система (0 - 9), непозиционная - римская, где для каждого числа используется специфическое сочетание символов XIV, CXXVII и т. д. Информация в ЭВМ кодируется в двоичной и двоично-десятичной форме. В двоичной системе любое число представляется комбинацией 0 и 1, что является очень удобным с точки зрения физики (два состояния: есть сигнал или нет сигнала, включено - выключено и т.д.). Двоично-десятичная система получила широкое распространение в современных ЭВМ ввиду легкости перевода в десятичную систему и обратно. В этой системе все десятичные числа кодируются четырьмя двоичными цифрами и в таком виде записываются последовательно друг за другом. При программировании иногда используется шестнадцатеричная система. Перевод из нее в десятичную - прост. Выполняется так же как из двоичной в десятичную.
В компьютерной технике используется двоичная система счисления. Ее выбор определяется реализацией аппаратуры ЭВМ (электронными схемами), в основе которой лежит использование двоичного элемента хранения данных – триггера. Он имеет два устойчивых состояния (~ вкл., выкл.), условно обозначаемых как 0 и 1 и способен хранить минимальную порцию данных равную 1 биту. Бит выступает в качестве элементарной единицы количества или объема хранимой (передаваемой) информации безотносительно к ее содержательному смыслу.
Если взять n триггеров, то количество всевозможных комбинаций нулей и единиц в них равно 2n. Формально появление 0 или 1 в ячейке можно рассматривать как равновероятные исходы событий, тогда, применив формулу Хартли I = log22n = n, можно сделать вывод, что в n триггерах можно хранить n бит информации.
Количество информации в 1 бит является слишком малой величиной, поэтому наряду с единицей измерения информации 1 бит, используется более крупная единица 1 байт
Итак, независимо от типа информации, кодируется она в виде элементарных единиц памяти, принимающих значения 0 или 1 и называемых битами.
Бит (binary digit -bit) - это разряд, принимающий значения 0 или 1. Байт (byte)- это единица представления одного символа информации, состоящая из 8-ми бит (1байт =8 бит =23 бит.). В компьютерной технике наименьшей адресуемой единицей является 1 байт. Байт служит также единицей измерения компьютерной информации, но когда счет идет на сотни тысяч и миллионы байт, то используются более крупные единицы, килобайты, мегабайты, гигабайты, терабайты и т.д.
В битах, байтах, килобайтах, мегабайтах и т.д. измеряется также потенциальная информационная ёмкость оперативной памяти и запоминающих устройств, предназначенных для хранения данных (жесткие диски, дискеты, CD-ROM и т.д.).
Для представления символов используются кодовые таблицы, в которых каждой букве, цифре или служебным знакам соответствует какой-либо код - десятичное число в диапазоне от 0 до 255. Таким образом, можно закодировать 256 символов, поскольку каждый символ - это 8 разрядов, то число возможных перестановок равно 28=256. Во всем мире в качестве стандарта принята таблица ASCII (American Standard Code for Information Interchange), в которой кодируется ровно половина символов от 0 до 127.
Вторая половина не определена американским стандартом и предназначена для размещения символов национальных алфавитов (в частности кириллицы), псевдографических символов и некоторых математических знаков. Таким образом, кодовая таблица ASCII состоит из основного стандарта и расширенного стандарта, который для различных операционных систем может различаться. Основной стандарт содержит десятичные коды от 0 до 127 (или шестнадцатеричные коды 00 - 7F), расширенный - десятичные коды от 128 до 255 (или шестнадцатеричные коды 8F - FF).
Основной стандарт
0 Цифры, знаки
Буквы латинского алфавита
Расширенный стандарт DOS
Расширенный стандарт WIN
128 Буквы национальных алфавитов
Символы псевдографики 255
128 Символы псевдографики
Буквы национальных алфавитов 255
Например, "0" - соответветствует десятичному коду 00, "." - соответветствует десятичному коду 46, латинская буква "А" - соответствует десятичному коду 65, строчная буква "q" - соответствует десятичному коду 113. Основной стандарт является общепринятым в мире, а расширенный в зависимости от операционной системы может меняться, поэтому для кодирования русских букв существуют и другие кодовые таблицы, например КОИ - 8 (код для обмена информацией). В настоящее ведущими фирмами предложена новая система кодировки символов Unicode (Universal Code), в которой каждый символ кодируется не одним, а двумя байтами, один из которых содержит сведения о языке принадлежности символа. Правда, объем информации увеличивается вдвое, но зато можно избавиться от множества перекодировщиков.