1. Понятие распределённой технологии обработки данных, её преимущества. Удалённый запрос
При использовании информационных сетевых технологий становится возможной реализация территориального распределения обработки информации.
Одной из важнейших сетевых технологий является распределённая обработка данных. Персональные компьютеры стоят на рабочих местах, то есть на местах возникновения и использования информации. Они соединены каналами связи. Это дало возможность распределить их ресурсы по отдельным функциональным сферам деятельности и изменить технологию обработки данных в направлении децентрализации. Распределённая обработка данных позволила повысить эффективность удовлетворения изменяющейся информационной потребности сотрудника таможенного органа и тем самым обеспечить гибкость принимаемых им решений.
Преимущества распределённой обработки данных:
- большое число взаимодействующих между собой пользователей, выполняющих функции сбора, регистрации, хранения, передачи и выдачи информации;
- снятие пиковых нагрузок с централизованной базы путем распределения обработки и хранения локальных баз данных на разных ЭВМ для обеспечения доступа информационного работника к вычислительным ресурсам сети ЭВМ;
- обеспечение симметричного обмена данными между удалёнными пользователями.
Введение классификации моделей представления данных на иерархические, сетевые и реляционные отразилось на архитектуре систем управления базами данных (СУБД) и технологии их обработки. Архитектура СУБД описывает её функционирование как взаимодействие информационных процессов двух типов: клиента и сервера.
Распределённая обработка и распределённая база данных не синонимы. Если при распределённой обработке производится работа с базой, то подразумевается, что представление данных, их содержательная обработка, работа с базой на логическом уровне выполняются на персональном компьютере клиента, а поддержание базы в актуальном состоянии на сервере. В случае использования распределённой базы данных последняя размещается на нескольких серверах. Работа с ней осуществляется на тех же персональных компьютерах или на других, и для доступа к удалённым данным надо использовать сетевую СУБД.
В системе распределённой обработки клиент может послать запрос к собственной локальной базе или удалённой. Удалённый запрос – единичный запрос к одному серверу. Несколько удалённых запросов к одному серверу объединяются в удалённую транзакцию. Если отдельные запросы транзакции обрабатываются различными серверами, то транзакция называется распределённой. При этом один запрос транзакции обрабатывается одним сервером. Распределённая СУБД позволяет обрабатывать один запрос несколькими серверами. Такой запрос называется распределённым. Только обработка распределённого запроса поддерживает концепцию распределённой базы данных.
2. Способы распределения данных
Организация обработки данных зависит от способа их распределения. Существуют централизованный, децентрализованный и смешанный способы распределения данных.
Централизованная организация данных является самой простой для реализации.
На одном сервере находится единственная копия базы данных. Все операции с базой данных обеспечиваются этим сервером. Доступ к данным выполняется с помощью удалённого запроса или удалённой транзакции.
Достоинством такого способа является лёгкая поддержка базы данных в актуальном состоянии, а недостатком – то, что размер базы ограничен размером внешней памяти: все запросы направляются к единственному серверу с соответствующими затратами на стоимость связи и временную задержку. Отсюда ограничение на параллельную обработку. База может быть недоступной для удалённых пользователей при появлении ошибок связи и полностью выходит из строя при отказе центрального сервера.
Децентрализованная организация данных предполагает разбиение информационной базы на несколько физически распределённых. Каждый клиент пользуется своей базой данных, которая может быть либо частью общей информационной базы, либо копией информационной базы в целом, что приводит к её дублированию для каждого клиента.
Распределение данных на основе разбиения. База данных размещается на нескольких серверах. Существование копий отдельных частей недопустимо. Достоинства этого метода: большинство запросов удовлетворяются локальными базами, что сокращает время ответа; увеличивается доступность данных и надёжность их хранения; стоимость запросов на выборку и обновление снижается по сравнению с централизованным распределением; система останется частично работоспособной, если выйдет из строя один сервер. Недостатки: часть удалённых запросов или транзакций может потребовать доступ ко всем серверам, что увеличивает время ожидания и цену обслуживания; необходимо иметь сведения о размещении данных в различных БД. Однако доступность и надёжность увеличиваются. Такие базы данных наиболее подходят к случаю совместного использования локальных и глобальных компьютерных сетей.
Распределение данных на основе дублирования заключается в том, что в каждом сервере сети размещается полная база данных. Это обеспечивает наибольшую надёжность хранения данных. Недостатки: повышенные требования к объему внешней памяти; усложнение корректировки баз, так как требуется синхронизация в целях согласования копий. Достоинство: все запросы выполняются локально, что обеспечивает быстрый доступ. Данный способ используется, когда фактор надёжности является критическим, база небольшая, интенсивность обновления невелика.
Смешанная организация хранения данных объединяет два способа распределения: разбиение и дублирование, приобретая при этом и преимущества и недостатки обоих способов.
Появляется необходимость хранить информацию о том, где находятся данные в сети. При этом достигается компромисс между объемом памяти под базу в целом и под базу в каждом сервере, чтобы обеспечить надёжность и эффективность её работы: легко реализуется параллельная обработка, то есть обслуживание распределённого запроса, или транзакции. Несмотря на гибкость смешанного способа организации данных остаётся проблема взаимозависимости факторов, влияющих на производительность системы, проблема её надёжности и выполнения требований к памяти. Смешанный способ организации данных можно использовать лишь при наличии сетевой СУБД.
3. Технология «клиент-сервер»
В базах данных коллективного пользования центральным технологическим звеном являются серверы баз данных.
Основная идея технологии «клиент-сервер» заключается в том, чтобы серверы расположить на мощных машинах, а приложения клиентов, использующих язык, - на менее мощных машинах. Сервер отправляет клиенту не полную копию базы данных, а только логически необходимые порции, тем самым, сокращая трафик сети (поток сообщений сети). В технологии «клиент-сервер» программы клиента и его запросы хранятся отдельно от СУБД. Сервер обрабатывает запросы клиентов, выбирает необходимые данные из базы данных, посылает их клиентам по сети, производит обновление информации, обеспечивает целостность и сохранность данных.
Основными видами технологии распределённой обработки данных являются:
1. Технология «клиент-сервер», ориентированная на автономный компьютер, то есть клиент и сервер размещены на одной ЭВМ.
2. Технология «клиент-сервер», ориентированная на централизованное распределение. Клиент получает доступ к данным одиночного удалённого сервера, данные могут только считываться, число запросов должно быть невелико.
3. Технология «клиент-сервер», ориентированная на локальную вычислительную сеть. Единственный сервер обеспечивает доступ к базе; клиент формирует процесс, отвечающий за содержательную обработку данных, их представление и логический доступ к базе; доступ к БД замедлен, так как клиент и сервер связаны через локальную сеть.
4. Технология «клиент-сервер», ориентированная на изменение данных в одном месте. То есть клиент может изменять данные только в своей локальной сети.
5. Технология «клиент-сервер», ориентированная на изменение данных в нескольких местах. Присутствует сервер-координатор, поддерживающий протокол передачи данных между различными серверами.
6. Технология «клиент-сервер», ориентированная на распределённую СУБД.
Тема 8. Телекоммуникационное обеспечение информационных таможенных технологий