ЦАТИ (Центр Автоматизации Теплофизических исследований)
Московский Энергетический Институт (ТУ)
Центр Автоматизации Теплофизических Исследований (ЦАТИ)
111250, Россия, Москва, Красноказарменная ул., д.14
Тел: +7 495 362 76 74, тел./факс: +7 495 918 14 01
ЦАТИ - Системный интегратор 
 
О компанииСистемная интеграцияАэрокосмосЭнергетикаТранспортНефть и газДатчикиОбразованиеЛабораторные практикумыБиблиотекаПубликации и статьиИнформационные материалыНормативные документыХудожественная проза

Ум всегда занят исследованием чего - либо. (Марк Тулий Цицерон)




Системы управления данными. Проблема надежности

Зуев В.И., Крюков В.М., Легоньков В.И.

Надежность базы данных и системы управления данными во многом определяет достоверность и сохранность данных, что в свою очередь является решающим условием эффективной работы вычислительной системы. При накоплении большого количества информации повышается уязвимость системы — возможность потери или искажения информации в результате сбоев и отказов. Последствия сбоев и отказов способны привести к существенному снижению производительности вычислительной системы как в отдельных частях, так и в целом.

Основными техническими причинами ненадежности систем управления данными являются:
- объем и сложность систем (по структуре, связям и функциям),
- вычислительная трудоемкость реализованных в них алгоритмов обработки различных информационных структур
- централизованное хранение данных.

Сбои и отказы систем управления данных иногда обусловлены не только их собственными внутренними ошибками, но и возмущениями окружающей среды. Аппаратура вычислительных средств должна быть обеспечена надёжными и стабильными условиями функционирования.

В техническое задание на создание вычислительного кластера должны входить условия обеспечения надежности системы:
— формулировки понятий, связанных о надежностью программного обеспечения;
— определение факторов, влияющих на надежность;
— выбор и обоснование критериев надежности;
— определение требований к программному обеспечению;
— методы проектирования и производства программных систем;
— методы проверки правильности, тестирования и отладки;
— моделирование и анализ надежности систем;
— управление подготовкой специалистов.

Система управления данными. Надежность


Развитие автоматизированных систем проверки, отладки и оценки программного обеспечения, систем автоматического конструирования программ позволяют справиться со сложностью программных сред, свести ее к минимуму.

Одна из задач обеспечении надежности ставит своей целью предупреждение появления программных ошибок. Другая задача – обеспечение устойчивости систем к внешним и внутренним возмущениям посредством введения различной избыточности для обнаружения возмущений и восстановления работоспособного состояния. Вторая задача особенно актуальна для систем управления реального времени: бортовых систем управления, систем управления воздушным движением, автоматизированных систем управления ответственными отраслями промышленности.

Высокий уровень ответственности расчетов, проводимых в процессе вычислительного эксперимента определяет и высокие требования к обеспечению достоверности полученных данных, что в свою очередь предъявляет соответствующие требования к надежности систем управления данными. Обеспечить приемлемое выполнение этих требований сегодня возможно-путем объединения рассмотренных выше задач. Традиционные приемы и методы программного тестирования позволяют сократить количество ошибок в процессе создания системы. Методы решения второй задачи дополняют систему средствами, обеспечивающими устойчивое функционирование при наличии ошибок влияния окружающей среды (внешних возмущений).

При разработке архитектуры системы используются приемы и методы:
— структуризация программных компонент и управляющей информации, необходимой- для функционирования системы;
— стандартизация интерфейсов между программными комплексами и операционной системой;
— унификация представления программных и информационных компонент системы;
— упорядочение связей между программными компонентами системы.

Этим упрощается система, облегчается и ускоряется ее изготовление, уменьшается время на отыскание и устранение программных ошибок и искажений управляющей информации.

При проектировании взаимодействия пользователя с системой основное внимание уделяется достижению простоты формы итого взаимодействия и его соответствия навыкам работы пользователя с данными. Этим преследуются две цели: минимизация ошибок пользователя и исключение их влияния на работу системы.

После разработки структуры системы проводится анализ с целью определения источников возмущений и выявления уязвимых компонент системы (чувствительных н возмущениям), а также анализ влияния искажений этих компонент на функционирование системы в целом. Методика такого анализа может основываться на результатах исследования известных систем управления данными, а также на опыте разработки и эксплуатации крупных систем общего назначения.

По результатам анализа определяются методы обеспечения устойчивости системы, основанные на использовании информационной и программной избыточностей. При этом решаются три основные задачи:
- ограничение аварийных последствий возмущений (таких, как прекращение функционирования системы, искажение жизненно важных объектов управляющей информации, искажение файлов и т. п.),
- контроль состояния системы,
- восстановление управляющей информации, файлов и системы.

Методы обеспечения устойчивости направлены на:
— на обнаружение возмущений, их диагностику, ограничение или ликвидацию их последствий;
— на поддержание сохранности управляющей информации;
— на оперативный и автономный контроль состояния управляющей информации, структурах файлов и системы в целом;
— на оперативное и автономное восстановление управляющей информации, файлов и функционирования системы.

В процессе изготовления системы запроектированная надежность обеспечивается:
— соблюдением технологии структурного и модульного программирования;
— проверкой логики работы каждого модуля;
— тестированием путей в модуле;
— созданием или имитацией аварийных ситуаций для определения фактической устойчивости алгоритма, модуля и системы в целом;
— проверкой работоспособности системы в условиях МВК.

При эксплуатации вычислительная система должна поддерживать достигнутую надежность. Для этого необходимы:
— подготовка персонала, отвечающего за нормальное функционирование системы, и средства программной поддержки деятельности системы;
— точные инструкции по эксплуатации системы, ее восстановлению после отказов, а также восстановлению управляющей информации и файлов после их искажения или потери;
— сбор статистической информации о всех обнаруженных, ошибках, возникших сбоях или отказах в работе системы, их, причинах, последствиях и времени устранения, анализ этой информации и принятие соответствующих мер.

Недостаточная корректность системы на первых этапах эксплуатации должна компенсироваться способностью противостоять собственным ошибкам, исключать или ограничивать их отрицательные последствия для сохранности данных. Это достигается организацией:
— встроенного контроля работы модулей системы, которые обеспечивают поиск трудноуловимых ошибок;
— автоматизированного контроля состояния управляющей информации, ее дублирования и в ряде случаев восстановления;
— оповещения оператора обо всех обнаруженных отклонениях и необходимых мерах, которые позволяют сократить время простоя системы при возникновении отказа;
— защиты жизненно важных компонент системы от случайного или преднамеренного искажения со стороны пользователя;
— контроля действий обслуживающего персонала над этими компонентами и регистрации выполняемых им коррекций.

Следует подчеркнуть, что повышение надежности системы управления данными связано с увеличением затрат на ее создание и возрастанием издержек при ее функционировании. Все это снижает производительность системы. Поэтому при создании системы управления данными тербуется минимизировать затраты и издержки при одновременном обеспечении приемлемого (высокого) уровня надежности.


Обеспечение надежности систем управления данных в сложных физических экспериментах и промышленных криогенных установках - серьезный аспект в книгах, посвященных криофизике и конкретным техническим разработкам в сфере криогеники.
Соответствующая литература представлена в библиотеке портала «Криофизика»:
Портал «Криофизика». Библиотека


Публикуется по изданию:
Зуев В.И., Крюков В.М., Легоньков В.И. Управление данными в вычислительном эксперименте. М., Наука., 1986. - 160 с.
Изображение: Gerd Altmann (pixabay)




    • Главная   • Библиотека   • Публикации и статьи   • Системы управления данными. Проблема надежности  
 
   начало
© Центр автоматизации теплофизических исследований (ЦАТИ), 1998-2021
Системы диагностики, контроля, управления для научных исследований, промышленных измерений, энергетических комплексов.
При перепечатке и использовании материалов сайта активная ссылка на www.cati.ru обязательна.
карта сайта