Все операционные системы, как правило, поддерживают следующие элементы иерархических файловых систем: обычные файлы, каталоги, специальные байт-ориентированные и блок-ориентированные файлы. Файл является массивом байтов (блоков фиксированной длины). Каталоги обеспечивают связь между именами файлов и собственно файлами. Каждый элемент каталога содержит имя файла и ссылку на конкретный файл. Для именования файлов используются корневой и текущий каталоги.
Внешние устройства (такие, как терминал, принтер) также часто представляются как файлы для упрощения работы с ними.
Устройства ввода-вывода могут быть подразделены на следующие типы:
• передачи информации битовым потоком ( например, 011100011);
• посимвольного обмена информацией (например, а_ f_ 1_c_ 25_ …) ;
• передачи информации порциями (записями - объёмами одной ячейки памяти)
Фактически это как бы «портрет» устройства, каким его «видит» прикладная программа, через посредство драйвера устройства и программ операционной системы, ответственных за ввод-вывод информации. Одно и то же устройство может быть представлено как генератор потока символов (потоко-ориентированное устройство) или записей (записе-ориентированное). Поэтому, скорее, стоит говорить о типе файлов, расположенных на том или ином устройстве.
Различают следующие виды файлов:
по типу записей:
- файлы с записями постоянной длины, (001 010 000 110 111 000 …
- файлы с записями переменной или неопределенной длины, (010 111100 0 110 0 0
- файлы, образующие байтовый или битовый поток; (001110010101001101010111_
по способу выборки информации:
- файлы последовательного доступа ( информация считывается подряд
- файлы прямого доступа ( информация считывается из указанной позиции,
- файлы доступа по индексу (обычно — файлы базы данных).
Далее возникает проблема идентификации данных, размещенных на носителе (в файле). Каким образом можно правильно сопоставить тем или иным битовым комбинациям, размещенным в файле, те или иные области оперативной памяти, куда они должны считываться с носителя, для последующей обработки или обновления. В частности, различные способы идентификации связаны с понятиями базового и стандартного буферизованного ввода-вывода.
В зависимости от типа и назначения файлов и возможностей ОС (методов доступа) файл может передаваться в прикладную программу как целое или блоками (физическими записями) либо логическими записями (строками, словами, символами).
В современных системах активно используется значительно большее разнообразие файлов, из которых мы перечислим наиболее типичные файлы данных:
• текстовый файл — обобщенное название для простых и размеченных текстов, ASCII-файлов и других наборов данных символьной информации, которые интерпретируются и обрабатываются текстовыми редакторами, процессорами, анализаторами (Lexicon, Word, TEC, анализаторы SGML, HTML);
• текст без разметки (планарный) — файл, содержащий только отображаемые (воспроизводимые на всех печатающих устройствах и терминалах) символы кода ASCII, а также простейшие управляющие символы: CR — возврат каретки; LF — перевод строки; TAB — символ табуляции, иногда LF — новая страница;
• текст с разметкой — планарный файл, содержащий бинарную и символьную разметку, управляющую отображением информации (программно и/или аппаратурно);
• ASCII-файл( читается аски-файл) — содержит только отображаемые коды левой части кодовой таблицы ASCII (латиница и служебные символы), обычно применяется для хранения документов с символьной разметкой (RTF, SGML, HTML);
• табличный файл — содержит форматированные данные (символьные, численные и др), образующие строки и столбцы таблиц, создаваемых и обрабатываемых табличными СУБД (FoxPro, Clipper, MS Access) и/или табличными процессорами (Su-perCalc, MS Excell и др.);
• графический файл — бинарный файл, содержащий графическую информацию. Форматы: TIF (Tagged Image File), BMP (Bit-Mapped Picture), а также ряд других — PCX, PIC и т. д.;
• мультимедиа файлы — бинарные файлы, содержащие оцифрованную аудио- (типы WAW или MIDI-Sequencer), видео- (формат MPEG) или смешанную информацию.
В табл. 1.2 приведены основные типы файлов, используемых в ОС DOS, Windows, и соответствующие им расширения имени.
Таблица 1.2. Основные типы (расширения) файлов, обрабатываемых в ПЭВМ
Тип, расширение имени
Вид информации, содержащейся в файле
exe, com
Программа, готовая к исполнению
bat
Текстовый командный файл
sys
Системный файл
ovi, ovr
Оверлейный файл .. "
pif
Программно-информационный файл Windows
txt,lst
Текстовый файл в формате DOS
doс
Документ (чаще всего в формате WinWord)
rtf
Размеченный текстовый файл (Rich Text Format)
dot
Файл формата документа (Document Type)
pdf
Формат документа Adobe Acrobat
wri
Документ редактора Write для Windows
wps
Документ текстового процессора MS WORKS
bak, old
Старая копия файла, создаваемая перед его изменением