Одной из основополагающих концепций, помогающих понять структуру операционных систем, является концепция процессов. Этот термин впервые был применен в 60-х годах разработчиками операционной системы Multics [DALE68] и с тех пор широко используется. Есть много определений термина "процесс", в том числе:
- выполняющаяся программа;
- экземпляр программы, выполняющейся на компьютере;
- объект, который можно идентифицировать и выполнять на процессоре;
- единица активности, которую можно охарактеризовать единой цепочкой последовательных действий, текущим состоянием и связанным с ней набором системных ресурсов.
Данная концепция станет более понятной по мере освоения материала.
В процессе развития компьютерных систем при решении проблем, связанных с распределением времени и синхронизацией, был сделан определенный вклад в развитие концепции процесса: разработаны системы групповой обработки нескольких программ, разделения времени и транзакций в реальном времени. Как мы уже могли убедиться, многозадачный режим дает возможность процессору и устройствам ввода-вывода работать одновременно, повышая тем самым эффективность использования компьютерной системы. При этом используется механизм, принцип работы которого заключается в следующем: в ответ на сигналы, свидетельствующие о завершении транзакций ввода-вывода, процессор переключается с одной программы на другую (при условии, что в оперативную память одновременно загружено несколько программ).
Другим направлением развития являются системы разделения времени. Основная цель их разработки — удовлетворение потребностей каждого пользователя при условии их одновременной работы. В этих системах используется тот факт, что пользователь реагирует на события намного медленнее, чем компьютер. К примеру, если потребность пользователя во времени процессора для обработки его действий в среднем составляет 2 с в течение 1 мин, то одной и той же системой, не мешая друг другу, могут пользоваться до 30 пользователей. Конечно же, в таких расчетах нужно учитывать время, которое требуется для работы самой операционной системы.
Еще одним важным направлением развития являются системы обработки транзакций в реальном времени. При работе таких систем некоторое число пользователей отправляют запросы в базу данных или вносят в нее изменения. Пример — система бронирования авиабилетов. Основное различие между системой обработки транзакций и системой разделения времени состоит в том, что в первой из них выполняются одно-два приложения, в то время как пользователи системы с разделением времени могут заниматься разработкой программ, запускать их и пользоваться многими различными приложениями. В обоих случаях ключевым фактором является время отклика системы.
Прерывание было важным инструментом, который стал доступен системным программистам еще на ранних стадиях развития многозадачных и многопользовательских интерактивных систем. Выполнение любого задания может быть прервано при наступлении определенного события, например завершения ввода-вывода. При этом процессор должен сохранить определенную информацию (такую, как содержимое программного счетчика, общих и системных регистров) и переключиться на выполнение программы обработки прерываний, которая выясняет природу прерывания, обрабатывает его, а затем возобновляет исполнение одного из заданий.
Устройство системного программного обеспечения, координирующего подобные процессы, оказалось очень сложным. При одновременной обработке многих заданий, каждое из которых включает в себя длинную последовательность действий, нельзя проанализировать все возможные комбинации последовательностей событий. Ввиду отсутствия систематических средств обеспечения координации и взаимодействия разных видов деятельности систем программисты обратились к специальным методам, основанным на представлении о той среде, работу которой должна контролировать операционная система. При этом они подвергались риску допустить трудноуловимые ошибки, которые проявляются только в очень редких случаях, при выполнении определенных последовательностей событий. Такие ошибки трудно обнаружить, потому что их нужно отличить от ошибок в приложениях и ошибок, возникающих при сбоях аппаратного обеспечения. Еще одной особенностью, затрудняющей определение причины этих ошибок (когда они обнаружены), является то, что воспроизвести точные условия, в которых эти ошибки проявляются, крайне трудно. Ниже перечислены основные причины подобных ошибок [DENN80a].
Неправильная синхронизация. Часто случается так, что программа должна приостановить свою работу и ожидать наступления какого-то события в системе. Например, программа, которая начала операцию ввода-вывода, не сможет продолжать работу, пока в буфере не будут доступны необходимые ей данные. В этом случае требуется передача сигнала от какой-то другой программы. Недостаточная надежность сигнального механизма может привести к тому, что сигнал будет потерян или что будет получено два таких сигнала.
Сбой взаимного исключения. Часто один и тот же совместно используемый ресурс одновременно пытаются использовать несколько пользователей или несколько программ. Например, в системе бронирования авиабилетов два пользователя могут запросить доступ к базе данных и при наличии свободных мест изменить ее, забронировав билеты. Если этот доступ не контролируется должным образом, возможно возникновение ошибок. Для корректной работы требуется некоторый механизм взаимного исключения, позволяющий в каждый момент времени выполнять транзакцию только одной программе. Правильность реализации такого взаимного исключения при всех возможных последовательностях событий крайне трудно проверить.
Недетерминированное поведение программы. Результат работы каждой программы обычно должен зависеть только от ее ввода и не должен зависеть от работы других программ, выполняющихся в этой же системе. Однако в условиях совместного использования памяти и процессора программы могут влиять на работу друг друга, переписывая общие области памяти непредсказуемым образом. При этом результат работы программ может зависеть от порядка, в котором они выполняются.
Взаимоблокировки. Возможны ситуации, в которых две или большее число программ зависают, ожидая действий друг друга. Например, двум программам может понадобиться, чтобы устройства ввода-вывода выполнили некоторую операцию (например, копирование с диска на магнитную ленту). Одна из этих программ осуществляет управление одним из устройств, а другая — другим. Каждая из них ждет, пока другая программа освободит нужный ресурс. Выйти из такой тупиковой ситуации может помочь система распределения ресурсов.
Для решения перечисленных проблем нужен систематический метод, основанный на слежении за различными выполняющимися процессором программами и управлении ими. В основе такого метода лежит концепция процесса. Мысленно процесс можно разделить на три компонента.
Выполняющаяся программа.
Данные, нужные для ее работы (переменные, рабочее пространство, буферы и т.д.).
Контекст выполнения программы.
Последний элемент является очень важным. Контекст выполнения (execution context), или состояние процесса (process state), включает в себя всю информацию, нужную операционной системе для управления процессом, и процессору — для его выполнения. Данные, характеризующие это состояние, включают в себя содержимое различных регистров процессора, таких, как программный счетчик и регистры данных. Сюда же входит информация, использующаяся операционной системой, такая, как приоритет процесса и сведения о том, находится ли данный процесс в состоянии ожидания какого-то события, связанного с вводом-выводом.
На рис. 2.8 показан пример реализации процессов. Два процесса, А и В, находятся в различных областях основной памяти. Другими словами, каждому процессу отведен блок памяти, в котором содержатся код программы, данные и информация о состоянии процесса. Каждый процесс заносится в список процессов, который создается и поддерживается операционной системой. Часть этого списка, соответствующая определенному процессу, содержит указатель размещения этого процесса в памяти. Кроме того, сюда же частично или полностью может входить и информация о состоянии процесса. Остальные данные могут храниться в самом процессе. В регистре индекса процесса содержится индекс выполняющегося в текущий момент времени процесса, идентифицирующий его в списке процессов. Содержимое программного счетчика указывает на очередную инструкцию, которую нужно выполнить. Базовый и граничный регистры задают область памяти, занимаемую процессом. В базовый регистр заносится адрес начальной ячейки этой области, а в граничный — ее размер (в байтах или словах).
Содержимое программного счетчика и всех ссылок на данные отсчитывается от значения базового регистра; по своей величине эти ссылки не могут превосходить значение граничного регистра (что защищает процессы от воздействия друг на друга).
Регистр индекса процесса, изображенный на рис. 2.8, указывает, что выполняется процесс В. До этого выполнялся процесс А, но он временно прерван. Содержимое всех регистров в момент прекращения этого процесса записано в виде данных о состоянии процесса. Впоследствии операционная система сможет вернуться к выполнению процесса А; при этом будет сохранен контекст выполнения процесса В и восстановлен контекст выполнения процесса А. Когда в программный счетчик загружается значение, указывающее на область кода программы процесса А, автоматически возобновляется выполнение этого процесса.
Таким образом, процесс реализуется в виде структуры данных. Он может выполняться или находиться в состоянии ожидания. Состояние процесса в каждый момент времени заносится в специально отведенную область данных. Использование структуры позволяет развивать мощные методы координации и взаимодействия процессов. В рамках операционной системы на основе данных о состоянии процесса путем их расширения и добавления в них дополнительной информации о процессе можно разрабатывать новые возможности операционных систем. При чтении книги нам встретится множество примеров использования описанной структуры в решении задач, возникающих при разработке многозадачных и многопользовательских операционных систем.
Рис. 2.8. Типичная реализация процессов