Надежность свойство объекта выполнять заданные функции, сохраняя во времени значения установленных эксплуатационных показателей в заданных пределах, соответствующих заданным режимам и условиям использования, технического обслуживания, ремонта, хранения и транспортировки. В соответствии с этим определением надежность является внутренним свойством системы, заложенным при ее изготовлении и проявляющимся при эксплуатации. Это свойство проявляется только во времени, и без более или менее длительного наблюдения и учета значений времени нельзя сделать заключения о надежности систем.
Для количественной оценки надежности применяется ряд показателей, выбор и приоритет которых зависят от конкретного типа и области применения объекта или системы. В основе этих характеристик лежат понятия о возможных состояниях системы: работоспособном и неработоспособном. Работоспособным называется такое состояние программного обеспечения, при котором ПО способно выполнять заданные функции с параметрами, установленными требованиями технической документации. В процессе функционирования ПО возможен переход из работоспособного состояния в неработоспособное и обратно. С этими переходами связаны события отказа и восстановления.
По полноте мероприятий, которые необходимо проводить для восстановления, различаются отказы: устойчивые, самоустраняющиеся и перемежающиеся. Для устранения устойчивого отказа требуется проведение специальных мероприятий по восстановлению работоспособности. Самоустраняющийся отказ или сбой характеризуется достаточно быстрым восстановлением работоспособности без внешнего вмешательства. Перемежающийся отказ представляет собой многократно повторяющиеся сбои, для полного устранения которых требуется внешнее вмешательство. По возможности восстановления работоспособности в процессе эксплуатации объекты делятся на восстанавливаемые и невосстанавливаемые. Невосстанавливаемые объекты не допускают ремонта или замены отказавших компонент и не обладают самовосстанавливаемостью во время выполнения своих функций. Такие объекты могут эксплуатироваться либо до первого отказа, либо до полного выполнения своих функций.
Основная цель контроля работоспособности состоит в своевременном выявлении фактов отказов или сбоев, в накоплении и обобщении данных, характеризующих работоспособность системы. Для контроля необходимы соответствующие ресурсы и затраты, которые в свою очередь могут влиять на работоспособность системы. Характеристики контроля - глубина и полнота проверок, степень автоматизации контрольных операций, длительность и порядок их выполнения и другие параметры - непосредственно влияют на оценку степени работоспособности системы.
Кроме контроля работоспособности применяется диагностический контроль, основное назначение которого состоит в локализации отказа, установлении его характера и причин. Диагностический контроль может способствовать установлению степени работоспособности системы, однако его основная цель заключается в обеспечении скорейшего восстановления. Для этого создаются методы и средства, позволяющие достаточно быстро обнаруживать причину отказа и локализовать ее с достаточной степенью детальности для быстрого устранения.