Текстовые данные рассматриваются как последовательность отдельных символов, каждому из которых ставится в соответствие двоичный код некоторого неотрицательного целого числа.
Для представления текстовой (символьной) информации в ПК используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации, т.к. 28 = 256. 8 бит = 1 байт, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.
Таблица кодировки – таблица, в которой устанавливается соответствие между символами и их порядковыми номерами в компьютерном алфавите (кодами). Нумерация символов: 0 – 255. Каждому номеру соответствует 8-разрядный двоичный код (00000000 –11111111). Для ПК IBM международным стандартом стала таблица ASCII– Американский стандартный код для информационного обмена. Стандартная часть ASCII – символы с кодами 0 –127 (01111111): буквы латинского алфавита, цифры, знаки препинания, скобки и др. Альтернативная часть – 128(10000000) – 255 (11111111) –буквы национальных алфавитов (русские), символы псевдографики.
Принцип последовательного кодирования - в кодовой таблице ASCII буквы и цифры располагаются в алфавитном порядке, а их коды в порядке возрастания.
Текстовая информация, хранящаяся в памяти ПК в двоичном коде, из-за многозначности неудобна для восприятия. Чаще всего внутреннее представление перекодируется в шестнадцатеричную форму. Шестнадцатеричный код каждого символа - двузначное число от 00 до FF.
ASCII позволяет закодировать только 256 символов.