При организации параллельного выполнения нескольких вычислительных процессов одной из главных функций операционной системы является решение сложной задачи корректного распределения ресурсов между выполняющимися процессами и обеспечение последних средствами взаимной синхронизации и обмена данными.
При параллельном исполнении процессов могут возникать тупиковые ситуации, когда два или более процесса блокируют друг друга, вынуждая ожидать наступления события, связанного с освобождением ресурса. Самым простым является случай, когда каждый из двух процессов ожидает ресурс, занятый другим процессом. Из-за такого ожидания ни один из процессов не может продолжить исполнение и освободить в конечном итоге ресурс, необходимый другому процессу. Эта ситуация называется тупиком, дедлоком (dead lock1), или клинчем. Говорят, что в мультипрограммной системе процесс находится в состоянии тупика, если он ждет события, которое никогда не произойдет. Тупики чаще всего возникают из-за конкуренции несвязанных параллельных процессов за ресурсы вычислительной системы, но иногда к тупикам приводят и ошибки программирования взаимодействующих вычислений.
' Dead lock (англ.) — смертельное объятие.
248_______________________ Глава 8. Проблема тупиков и методы борьбы с ними
При рассмотрении проблемы тупиков целесообразно понятие ресурсов системы обобщить и разделить их все на два класса:
- повторно используемые (Reusable Resource, RR), или системные (System Re source, SR), ресурсы;
- потребляемые, или расходуемые, ресурсы (Consumable Resource, CR).
Системные ресурсы (SR) есть конечное множество идентичных единиц некоторого вида ресурсов, обладающих следующими свойствами [54]:
- число единиц ресурса в системе неизменно;
- каждая единица ресурса либо доступна, либо выделена одному и только одно му процессу (разделение отсутствует или не принимается во внимание, так как не оказывает влияния на распределение ресурсов, а значит, и на возникновение тупиковой ситуации);
- процесс может освободить единицу ресурса (сделать ее доступной), только если он ранее получил эту единицу, то есть никакой процесс не может оказывать влияние на ресурс, если этот ресурс ему не принадлежит.
Данное определение выделяет существенные для изучения проблемы тупика свойства системных ресурсов, к которым мы относим компоненты аппаратуры, такие как основная память, вспомогательная (внешняя) память, периферийные устройства и, возможно, процессоры, а также программное и информационное обеспечение, такое как файлы данных, таблицы и «разрешение войти в критическую секцию».
Расходуемые ресурсы (CR) отличаются от ресурсов типа SR в нескольких важных отношениях [17].
- Число доступных единиц некоторого ресурса типа CR изменяется по мере того, как выполняющимися процессами они расходуются (приобретаются) и освобождаются (производятся). В общем случае число единиц расходуемых ресурсов является потенциально неограниченным, поскольку некий процесс «производитель» может достаточно долго увеличивать число единиц ресурса, освобождая одну или более единиц, которые он «создал».
- Процесс «потребитель» уменьшает число единиц ресурса, сначала запрашивая и затем приобретая (потребляя) одну или более единиц. Единицы ресурса, ко торые приобретены, в общем случае не возвращаются ресурсу, а потребляются (расходуются). Эти свойства потребляемых ресурсов присущи многим синхро низирующим сигналам, сообщениям и данным, порождаемым как аппаратурой, так и программным обеспечением, и могут рассматриваться как ресурсы типа CR при изучении тупиков. В их число входят: прерывания от таймера и уст ройств ввода-вывода; сигналы синхронизации процессов; сообщения, содержа щие запросы на различные виды обслуживания или данные, а также соответ ствующие ответы.
Для исследования параллельных процессов и, в частности, проблемы тупиков было разработано несколько моделей. Одной из них является модель повторно используемых ресурсов Холта [54]. Согласно этой модели система представляется как набор (множество) процессов и набор ресурсов, причем каждый из ресурсов состоит из
Примеры тупиковых ситуаций и причины их возникновения_____________________ 249
фиксированного числа единиц. Любой процесс может изменять состояние системы путем выдачи запроса на получение или освобождение единицы ресурса.
В графической форме процессы и ресурсы представляются квадратами и кружками соответственно. Каждый кружок содержит некоторое количество маркеров (фишек) в соответствии с существующим количеством единиц этого ресурса. Дуга, указывающая из «процесса» на «ресурс», означает запрос одной единицы этого ресурса. Дуга, указывающая из «ресурса» на «процесс», представляет выделение ресурса процессу. Поскольку каждая единица любого ресурса типа SR может быть выделена одновременно не более чем одному процессу, то число дуг, исходящих из ресурса к различным процессам, не может превышать общего числа единиц этого ресурса. Такая модель называется графом повторно используемых ресурсов.
Пример одного из состояний системы из двух процессов с ресурсами типа SR представлен на рис. 8.1.
Рис. 8.1. Пример модели Холта
Пусть процесс Пр1 запрашивает две единицы ресурса R1 и одну единицу ресурса R2. Процессу Пр2 принадлежат две единицы ресурса R1, и ему нужна одна единица R2. Предположим, что процесс Пр1 получил запрошенную им единицу R2. Если принято правило, по которому процесс должен получить все запрошенные им ресурсы прежде, чем освободить хотя бы один из них, то удовлетворение запроса Пр1 приведет к тупиковой ситуации: Пр1 не сможет продолжиться до тех пор, пока Пр2 не освободит единицу ресурса R1, а процесс Пр2 не сможет продолжиться до тех пор, пока Пр1 не освободит единицу R2. Причиной этого тупика являются неупорядоченные попытки процессов войти в критическую секцию, связанную с выделением соответствующей единицы ресурса.
Примеры тупиковых ситуаций и причины их возникновения
Для понимания основных причин возникновения тупиков рассмотрим несколько простых характерных примеров.
250_______________________ Глава 8. Проблема тупиков и методы борьбы с ними
Пример тупика на ресурсах типа CR
Пусть имеется три процесса Пр1, Пр2 и ПрЗ, которые вырабатывают сообщения Ml, M2 и МЗ соответственно. Эти сообщения представляют собой ресурсы типа CR. Пусть процесс Пр1 является потребителем сообщения МЗ, процесс Пр2 должен получить сообщение Ml, а ПрЗ ожидает сообщение М2 от процесса Пр2. Таким образом, каждый из этих трех процессов является и поставщиком, и потребителем одновременно, и вместе они образуют кольцевую систему (рис. 8.2) передачи сообщений через почтовые ящики (ПЯ).
Рис.8.2. Кольцевая схема взаимодействия процессов
Если связь с помощью этих сообщений со стороны каждого процесса устанавливается в порядке, представленном в листинге 8.1, то никаких проблем не возникает. Однако перестановка этих двух процедур в каждом из процессов вызывает тупик (листинг 8.2).
Листинг 8.1. Вариант псевдокода без тупиковой ситуации
Пр1:
ПОСЛАТЬ СООБЩЕНИЕ (Пр2, Ml. ПЯ2): ЖДАТЬ СООБЩЕНИЕ (ПрЗ. МЗ. ПЯ1);
Пр2:
ПОСЛАТЬ СООБЩЕНИЕ (ПрЗ, М2. ПЯ3); ЖДАТЬ СООБЩЕНИЕ (Пр1. Ml. ПЯ2);
ПрЗ:
ПОСЛАТЬ СООБЩЕНИЕ (Пр1. МЗ. ПЯ1): ЖДАТЬ СООБЩЕНИЕ (Пр2. М2. ПЯЗ);
Примеры тупиковых ситуаций и причины их возникновения_____________________ 251
Листинг 8.2. Вариант псевдокода с тупиковой ситуацией
Пр1:
ЖДАТЬ СООБЩЕНИЕ (ПрЗ, МЗ. ПЯ1): ПОСЛАТЬ СООБЩЕНИЕ (Пр2. Ml. ПЯ2);
Пр2:
ЖДАТЬ СООБЩЕНИЕ (Пр1. Ml. ПЯ2): ПОСЛАТЬ СООБЩЕНИЕ (ПрЗ. М2. ПЯЗ):
ПрЗ:
ЖДАТЬ СООБЩЕНИЕ (Пр2. М2. ПЯЗ): ПОСЛАТЬ СООБЩЕНИЕ (Пр1. МЗ. ПЯ1):
В самом деле, во втором варианте ни один из процессов не сможет послать сообщение до тех пор, пока сам его не получит, а это событие никогда не произойдет, поскольку ни один процесс не может этого сделать.
Пример тупика на ресурсах типа CR и SR
Пусть некоторый процесс Пр1 должен обменяться сообщениями с процессом Пр2 и каждый из них запрашивает некоторый ресурс R, причем Пр1 требует три единицы этого ресурса для своей работы, а Пр2 — две единицы и только на время обработки сообщения. Всего же имеется только четыре единицы ресурса R. Запрос и освобождение ресурса можно реализовать через соответствующий монитор с процедурами REQUESTER, N) — запрос N единиц ресурса R, и RELEASE(R, N) — освобождение (возврат) N единиц ресурса R. Обмен сообщениями будем осуществлять через почтовый ящик MB. Фрагменты программ Пр1 и Пр2 приведены в листинге 8.3.
Пр2: WAIT_MESSAGE ( Пр1. сообщение, MB ): REQUEST ( R. 2 ): ОБРАБОТКА СООБЩЕНИЯ: RELEASE ( R. 2 ): продолжением
252_______________________ Глава 8. Проблема тупиков и методы борьбы с ними
Листинг 8.3(продолжение)
SEND_ANSWER ( ответ. MB ):
Увы, эти два процесса всегда будут попадать в состояние тупика. Действительно, процесс Пр2, выполняясь первым, сначала будет ожидать сообщения от процесса Пр1, после чего будет заблокирован при запросе ресурса R, часть которого окажется уже отданной процессу Пр1. Процесс Пр1, завладев частью ресурса R, будет заблокирован ожиданием ответа от Пр2, которого никогда не получит, так как для этого Пр2 нужно получить ресурс R, находящийся в распоряжении Пр1. Тупика можно избежать лишь при условии, что на время ожидания ответа от Пр2 процесс Пр1 отдаст хотя бы одну из единиц ресурса R, которыми он владеет. В данном примере, как и в предыдущем, причиной тупика являются ошибки программирования.
Пример тупика на ресурсах типа SR
Предположим, что существуют два процесса Пр1 и Пр2, разделяющих два ресурса типа SR: R1 и R2. Пусть взаимное исключение доступов к этим ресурсам реализуется с помощью семафоров S1 и S2 соответственно. Процессы Пр1 и Пр2 обращаются к ресурсам так, как показано на рис. 8.3 [17].