Форматная базавключает типы, форматы и структуры данных, записей, документов.
Тип данных определяется типом значений, которые могут принимать данные (константы, переменные, выражения) и множеством допустимых операций над ними.
В языках программирования, системах управления базами данных, информационно-поисковых системах используют следующие основные типы данных: целый (integer), действительный (real), двоичный (binary), логический (boolean), символьный (char), длинный текстовый (memo), дата (date), время (time) и другие.
Структуры:
данных — элементарные данные, массивы; записей — агрегаты данных (именованные группы переменных разного типа);
документов — файл (совокупность данных об объектах, при этом данные могут быть структурированы в элементарные или агрегатные (групповые) поля).
Основные структуры данных: массивы, записи, текстовые поля, множественные поля записи, групповые поля записи, повторяющиеся поля записи.
Формат — вид записи данных, организованных в файлы. Тип и назначение файла определяют его формат. В операционных системах (ОС), как правило, имеется два типа файлов: символьные и двоичные. В символьном виде обычно представлены исходные данные и программы, а в двоичном — программы, записанные в машинных кодах. Тип файла обозначается в расширении его имени. Например, исполняемые программы имеют расширение — ехе и com, командный файл — bat, системный файл — sys, текстовый файл в формате ОС MS DOS — txt, а ОС Windows — doc и т. д. Текстовые файлы программ, написанных на определенном языке программирования, имеют и определенное расширение. Например, для программ на языке Assembler — asm, на Basic — bas, на языке Pascal — pas, на С — с.
В настоящее время в различных системах имеется большое разнообразие форматов файлов. Они могут иметь следующие расширения:
табличные файлы (форматированы по столбцам и строкам, содержат информацию разного типа) — wks, xls, а также файлы реляционных баз данных — dbf;
звуковые файлы — wav, mid, mp3, mod;
видеофайлы — avi, mov, mpg;
мультимедиафайлы (содержат информацию разного вида — аудио, видео) — mpeg и другие.
Для обмена информацией между системами существуют коммуникативные (обменные) форматы: МЕКОФ, карточный — для обмена библиографической информацией; MARC — для обмена библиотечно-справочной информацией, полнотекстовой документальной информацией — HTML, SGML, RTF, ODA и другие.
При использовании этих форматов следует учитывать необходимость правильного распознавания и «привязывания» данных, переносимых из одной системы в другую, а также обнаружения ошибок считывания и пропуска данных.
С этой целью применяют специальные методы записи данных: постоянной и переменной длины. При использовании метода записи постоянной длины строго соблюдают на носителе постоянство предусмотренной длины записи, используют разделители, метки, идентификаторы, могут в первом байте каждой записи указывать ее длину и т. д. Для записей переменной длины ограничителем является распознаваемая устройством физическая метка.
Унифицированные документы, используемые в АСУ, представляют собой набор форм организационно-распорядительной информации в соответствии со стандартом и форм для внутрисистемного пользования.