Числовая информация внутри ПК кодируется в двоичной или в двоично-десятичной системах счисления; при вводе и выводе любой информации в ПК используются специальные коды представления информации — коды ASCII, эти же коды применяются для кодирования буквенной и символьной информации и внутри ПК.
Для удобства работы введены следующие термины для обозначения совокупностей двоичных разрядов (табл. 3.2). Эти термины обычно используются в качестве единиц измерения объемов информации, хранимой или обрабатываемой в компьютере.
Таблица 3.2. Двоичные совокупности
Количество двоичных разрядов в группе
Наименование единицы измерения
Бит
Байт
Параграф
8 * 1024
Кбайт (килобайт)
8 * 10242
Мбайт (мегабайт)
8 * 10243
Гбайт (гигабайт)
8 * 10244
Тбайт (терабайт)
8 * 10245
Пбайт (пентабайт)
Последовательность нескольких бит или байт часто называют полем данных.
Биты в числе (в слове, в поле и т. п.) нумеруются справа налево, начиная с 0-го разряда. В ПК могут обрабатываться поля постоянной и переменной длины.
Поля постоянной длины:
· слово — 2 байт;
· двойное слово — 4 байт;
· полуслово — 1 байт;
· расширенное слово — 8 байт.
Числа с фиксированной запятой чаще всего имеют формат слова и полуслова; числа с плавающей запятой — формат двойного и расширенного слова.
Поля переменной длины могут иметь любой размер от 0 до 255 байт, но обязательно равный целому числу байт.
Пример.Структурно запись двоичного числа –11000001(2), равного десятичному –193(10), в разрядной сетке ПК выглядят следующим образом (рис. 3.1, 3.2).
Рис. 3.1. Число с фиксированной запятой формата слово со знаком
Рис. 3.2. Число с плавающей запятой формата двойное слово
Двоично-кодированные десятичные числа могут быть представлены в ПК полями переменной длины в так называемых упакованном (рис. 3.3) и распакованном форматах. В упакованном формате для каждой десятичной цифры отводится по три двоичных разряда (полбайта), при этом знак числа кодируется в крайнем правом полубайте числа (1100 — знак «+» и 1101 — знак «–»).
Рис. 3.3. Структура поля упакованного формата
Здесь и далее: Цф — Цифра, Знак — Знак числа. Упакованный формат используется обычно в ПК при выполнении операций сложения и вычитания двоично-десятичных чисел.
В распакованном формате (рис. 3.4) для каждой десятичной цифры отводится по целому байту, при этом старшие полубайты (зона) каждого байта (кроме самого младшего) в ПК заполняются кодом 0011 (в соответствии с ASCII-кодом), а в младших (левых) полубайтах обычным образом кодируются десятичные цифры. Старший полубайт (зона) самого младшего (правого) байта используется для кодирования знака числа.
Рис. 3.4. Структура поля распакованного формата
Распакованный формат используется в ПК при вводе-выводе информации, а также при выполнении операций умножения и деления двоично-десятичных чисел.
Например, число –193(10) = –000110010011(2 – 10) в ПК будет представлено:
· в упакованном формате:
0001 1001 0011 1101
· в распакованном формате:
0011 0001 0011 1001 1101 0011
Код ASСII (American Standard Code for Information Interchange — американский стандартный код для обмена информацией) имеет основной стандарт и расширение (рис. 3.5). Основной стандарт для кодирования символов использует шестнадцатеричные коды 00–7F, расширение стандарта — коды 80–FF.
Основной стандарт является международным и используется для кодирования управляющих символов и букв латинского алфавита; в расширении стандарта кодируются символы псевдографики и буквы национального алфавита (естественно, в разных странах разные). Пользоваться таблицей достаточно просто. Следует приписать шестнадцатеричную цифру номера строки справа к шестнадцатеричной цифре номера столбца. Так получится шестнадцатеричный код символа.
ПРИМЕЧАНИЕ. Любой символ, представленный в этой таблице, при работе в DOS может быть введен в ПК с клавиатуры набором его десятичного кода (соответствующего шестнадцатеричному ASCII-коду) на малой цифровой клавиатуре при нажатой клавише Alt.
Наряду с кодом ASCII в ВС, в частности в сети Интернет, используется общий для всех стран мира универсальный код — Уникод (Unicode). Этот код основан на паре байт — машинном слове. Шестнадцати бит хватает для отображения 65 535 знаков. Такого количества достаточно для всех существующих алфавитов (то есть алфавиты большинства стран мира размещаются в основном стандарте этого кода).