Существует множество систем представления данных. С одной из них, принятой в информатике и вычислительной технике, двоичным кодом, мы познакомились выше. Наименьшей единицей такого представления является бит (двоичный разряд). Совокупность двоичных разрядов, выражающих числовые или иные данные, образуют некий битовый рисунок. Практика показывает, что битовым представлением удобнее работать, если этот рисунок имеет регулярную форму. В настоящее время в качестве таких форм используются группы из восьми битов, которые называют байтами.
Десятичное число
Двоичное число
Байт
0000 0001
0000 0010
…
…
…
1111 1111
Понятие о байте как о группе взаимосвязанных битов появились вместе с первыми образцами электронной вычислительной техники. Долгое время понятие байта было машинно-зависимым, то есть в различных вычислительных машинах длина байта была разной. Только в конце 60-х годов понятие байта стало универсальным и машинно-независимым.
Выше мы видели, что во многих случаях целесообразно использовать не восьмиразрядное кодирование, 16-разрядное, 24-разрядное, 32-разрядное и более. Группа из 16-ти взаимосвязанных бит (двух взаимосвязанных байтов) в информатике называется словом. Соответственно, группа из четырёх взаимосвязанных байтов (32 разряда) называются удвоенным словом, а группа из восьми байтов (64 разряда) – учетверённым словом.
Существует много систем и единиц измерения данных. Каждая научная дисциплина и каждая область человеческой деятельности может использовать свои, наиболее удобные и традиционно устоявшиеся единицы. В информатике для измерения данных используют тот факт, что разные типы данных имеют универсальное двоичное представление и поэтому вводят свои единицы данных, основанные на нём.
Наименьшей единицей измерения является байт. Поскольку одним байтом, как правило, кодируется один символ текстовой информации, то для текстовых документов размер в байтах соответствует лексическому объёму в символах (пока исключение составляет универсальная кодировка UNICODE).
Более крупная единица – килобайт (Кбайт). Условно можно считать 1 Кбайт примерно равен 1000 байт. Условность связана с тем, что для вычислительной техники, работающей с двоичными числами, более удобно представление чисел в виде степени двойки и потому на самом деле 1 Кбайт равен 210 байт (1024 байт).
В килобайтах измеряют сравнительно небольшие объёмы данных. Условно можно считать, что одна страница неформатированного машинного текста составляет около 2 Кбайт.
Более крупные единицы измерения данных образуются добавлением префиксов мега-, гига-, тера-, пента-, экса-, зета-, йотта-.
Единицы
Значения
Метрический аналог
1 Кбайт
1024 байта (210 )
1000 (102)
1 Мбайт
1024 Кбайт (220 )
1000000 (106)
1 Гбайт
1024 Мбайт (230 )
109
1 Тбайт
1024 Гбайт (240)
1012
1 Пбайт
1024 Тбайт (250 )
1015
1 Эбайт
1024 Пбайт (260 )
1018
1 Збайт
1024 Эбайт (270)
1021
1 Йбайт
1024 Збайт (280)
1024
Особо обратим внимание на то, что при переходе к более крупным единицам «инженерная» погрешность, связанная с округлением, накапливается и становится недопустимой, поэтому на старших единицах измерения округления производятся реже.