Необходимость программного контроля вызвана имеющимися недостатками существующих аппаратурных методов контроля: недостаточными полнотой охвата и глубиной контроля всех устройств ЭВМ, а также большими затратами оборудования для обеспечения высокой эффективности аппаратурного контроля и, следовательно, большой стоимостью.
В качестве разновидностей программного контроля, позволяющих контролировать правильность решения задач на ЭВМ, можно привести контроль повторным счётом, двойной счёт по различным программам и двойной счёт на различных устройствах.
Сущность метода повторного счёта состоит в том, что отдельные действия по передаче данных, переработке информации и т.д. повторяются многократно. Полученные при этом результаты сравниваются между собой. Правильным результатом считается тот, который даёт наибольшее количество совпадений.
Метод контроля двойным счётом по различным программам заключается в том, что одна и та же задача решается дважды. Первый раз решение происходит по программе основного алгоритма, а во второй раз - по программе упрощенного алгоритма. Если результаты просчётов совпали с заданной точностью, то первый результат считается верным и происходит переход к следующему участку программы. Если совпадение не происходит, то вновь дважды повторяют контролируемый участок программы, после чего делается сравнение всех полученных результатов и принимается решение о переходе к следующему участку программы.
В системах, которые имеют несколько однотипных устройств переработки информации (например, многопроцессорные ЭВМ), может быть использована следующая модификация метода повторного счёта. Одна и та же программа реализуется одновременно на двух различных устройствах. Полученные результаты сравниваются между собой. В случае их совпадения результат считается верным и происходит переход к следующему участку программы. При несовпадении результатов процесс повторяется. Затем необходимо осуществить сравнение полученных результатов и принять решение о их правильности.
Данный метод имеет коэффициент производительности, близкий к единице, но требует для своей реализации не менее двух однотипных устройств.
Проверяющие тесты. Проверяющие тесты предназначены для проверки правильности функционирования аппаратуры ЭВМ. Принцип работы тестового контроля состоит в том, что на вход контролируемого устройства подают специально подобранную совокупность входных воздействий и наблюдают реакцию на выходе. Сравнивая полученную реакцию с эталонной, судят о правильности функционирования устройства.
Тестовый контроль обеспечивает проверку пребывания устройств ЭВМ в работоспособном состоянии на момент контроля. В отличие от аппаратурного и аппаратурно-микропрограммного контроля он не может быть использован для проверки состояния устройств в процессе выполнения ими основной задачи, но может применяться периодически в процессе функционирования ЭВМ между решениями основных задач.
Рассмотрим особенности тест-программного контроля различных устройств.
Поскольку процессоры предназначены для выполнения различных операций, то тест-программная проверка процессора должна предусматривать выполнение всех возможных операций с различными операндами и проверку правильности полученных результатов. Код выполняемой операции и операнды здесь нужно рассматривать как входное слово, а результат операции - как выходное.
Тест-программный контроль памяти включает в себя проверку оперативной, постоянной и внешней памяти. Суть контроля этих видов памяти состоит в записи определённых слов в отдельные ячейки, считывании и сравнении с эталонами. Однако проверка для каждого вида памяти имеет свою специфику.
Отметим, что сама тест-программа проверки оперативной памяти расположена в ней же, следовательно, проверить ячейки, где находится программа, непосредственно невозможно. Поэтому оперативную память делят на две части и контролируют их поочерёдно, располагая тест-программу в неконтролируемой части памяти. Суть контроля оперативной памяти состоит в том, что в ячейки записываются слова, которые затем считываются и сравниваются с эталонами. Для того чтобы проверить оперативную память с полнотой охвата, равной единице, нужно проверить каждую ячейку на правильность хранения хотя бы двух поразрядно неравнозначных слов. В частном случае первое слово может иметь единицы во всех разрядах, а второе - нули.
ПЗУ контролируется только на правильность считывания информации. Следовательно, вначале нужно ввести в оперативную память эталоны, а затем последовательно из отдельных ячеек ПЗУ произвести считывание слов и сравнение их с эталонами.
Внешняя память (жесткие и гибкие магнитные диски, ленты) имеет ту особенность, что запись и считывание информации происходит массивами. Суть проверки состоит в формировании эталонных массивов, записи их во внешнюю память, считывании и сравнении с эталоном.
Нарушения работы управляющего автомата ведёт к полному нарушению процесса вычислений. Поэтому проверка работоспособности УА является важным элементом контроля вычислительной машины. Контроль сводится к тому, что программным способом создаётся некоторая эталонная обстановка (ОА выдаёт различные осведомительные сигналы). УА реагирует на эти сигналы, а тест проверяет соответствие этой реакции эталону. Если УА неверно вырабатывает последовательность микрокоманд, то принимается решение о неверной работе управляющего автомата. Такой метод проверки целесообразно применять для контроля микропрограмм, хранящихся в ПЗУ.
Диагностические тесты. Диагностические тесты служат для отыскания места отказа в аппаратуре. Основные задачи, возлагаемые на диагностические тесты, следующие:
- получение информации, необходимой для локализации места отказа;
- обработка полученной информации и определение места отказа;
- индикация отказавшего элемента (при автоматической диагностике) на устройствах отображения.
Между проверяющими и диагностическими тестами нет четкой границы. Как правило, диагностические тесты строятся на базе проверяющих, т.е. используются сведения о состоянии устройства, полученные в результате применения проверяющих тестов.
Рассмотрим общий подход к построению диагностических тестов. Устройство, подлежащее диагностике, рассматривается как конечный автомат с известной внутренней структурой. Суть диагностики состоит в исследовании реакции автомата при подаче на его вход последовательности входных слов. Так как структура автомата известна, то для каждой входной последовательности известны элементы, участвующие в выработке последовательности выходных слов. Совпадение выходной последовательности с эталоном свидетельствует о том, что соответствующие элементы работают правильно. Несовпадение с эталоном показывает, что среди соответствующих элементов имеются отказавшие. Подачей на вход новых последовательностей стремятся сузить область находящихся под подозрением элементов до пределов требуемой. Данная методика построения диагностических тестов может обеспечить локализацию отказов с любой требуемой точностью. Однако количество испытаний и время их выполнения будут чрезвычайно велики.