По мере развития человечество накапливает все большие и большие объемы информации, и становится все труднее простыми ранее разработанными методами перерабатывать эти объемы. Действия, выполняемые с информацией, называются информационными процессами. Обычно выделяют 3 типа информационных процессов: хранение информации, обработка и передача.
В качестве нового современного инструмента по обработке информации сегодня используется компьютер. Изначально это орудие труда называлось ЭВМ - электронно-вычислительная машина, т.к. была разработана для выполнения сложных математических процессов. Но со временем перечень ею выполняемых услуг расширился, ЭВМ сменила имя на Компьютер и стала удобным универсальным инструментом/помощником человека при выполнении многих функций. Сегодня компьютер помогает секретарю, художнику, мультипликатору, конструктору, математику, бухгалтеру, библиотекарю, кассиру, статисту. Его возможности можно применить практически во всех сферах деятельности человека: или для хранения информации, или для ее обработки/переработки, или для передачи информации на определенные расстояния. А чаще всего используется гибрид этих функций.
Применительно к компьютеру информация - это произвольная последовательность закодированных цифр, текстовых, графических и звуковых кодов, управляющих команд. С точки зрения количества информации каждый закодированный символ или команда представляет единицу информации. С точки зрения информационных объемов компьютеру безразличен смысл введенных кодов.
Самая удобная форма кодирования информации, к которой пришли при разработке ЭВМ (компьютера), - это кодирование с помощью 2-х состояний/значений: "Есть сигнал" и "Нет сигнала". Применительно к электронным схемам: "Есть напряжение" и "Нет напряжения", "Есть заряд" и "Нет заряда". Именно в этом направлении удалось создать надёжно работающие технические устройства, которые могут обеспечить 100%-ную надёжность сохранять и распознавать не более 2-х различных состояний (например: в электромагнитное реле состояние «замкнуто» и «разомкнуто», состояния «намагничено» и «не намагничено» на участках магнитных носителей информации – дисках, на лазерном диске участок поверхности отражает или не отражает луч, триггер надёжно удерживает определённый уровень напряжения в электрических схемах). Одно информационное состояние устройств принимается за математическую "1", другое – за математический "0". И эта форма запоминания информации через цифры "1" и "0" называется "Двоичным кодированием", а цифры "0" и "1" называются битами (от англ. слова bit - двоичная цифра). При двоичном кодировании элементу информации сопоставляется его код - последовательность из фиксированного количества нулей и единиц. А информация в компьютере бывает текстовая, числовая, графическая, видео, звуковая, команды (типы данных). И каждый вид информации кодируется в компьютере по своим законам/правилам. Принято информацию в компьютере кодировать через 8 единичек и ноликов – разрядов, т.е. посредством 8-ми бит. Сочетание 8 бит называют байтом (англ. byte). Бит и Байт также являются единицами измерения объёмов информации.
Бит – минимальная единица измерения информации.
Кратные единицы измерения информации:
1 байт = 8 бит;
1 Кбайт = 210 = 1024 байт;
1 Мбайт = 220 = 1048576 байт;
1 Гбайт = 230 » 1 млрд.байт
Кодирование текстов. По мере разработки ЭВМ возникали самые различные правила кодировки текстовых символов, но по мере заполнения мирового рынка компьютерами фирмы IBM самым распространенным видом кодирования символов стал стандарт ASCII - кодов, в переводе на русский АСКОИ - коды (алфавитный стандартный код обработки информации). В этом стандарте используется 8-разрядное кодирование символов – т.е. побайтное. Фрагмент таблицы соответствия кодов символам по этому стандарту:
01000000 – буква a_лат
00100010 – “ (кавычки)
00110001 – 1 (единица)
01000001 – буква b_лат
00100101 - % (проценты)
00110010 – 2 (двойка)
01000010 – буква c_лат
00100100 - $ (доллар)
00110011 – 3 (тройка)
С помощью байта можно закодировать 28=256 различных символов текстовой информации. Этого количества сочетаний достаточно, чтобы охватить русский и латинский шрифты, все цифры (от 0 до 9 как текстовые символы), различные текстовые знаки типа !,?,*,%,№,/,+,=,),(,$,&,@ и т.п. и ещё набор каких-нибудь графических символов. В современных программах работы с текстами используется более современная таблица кодирования символов через 2 байта – таблица Unicode. В ней представлено 216 кодов различных символов.