русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Интернет-технология


Дата добавления: 2014-05-22; просмотров: 1678; Нарушение авторских прав


 

Локальные сети обычно объединяют несколько десятков компьютеров, размещенных в одном здании, однако они не позволяют обеспечить совместный доступ к информации пользователям, находящимся, например, в различных частях города. На помощь приходят региональные сети, объединяющие компьютеры в пределах одного региона (города, страны, континента).

Многие организации, заинтересованные в защите информации от несанкционированного доступа (например, военные, банковские и пр.), создают собственные, так называемые корпоративные сети. Корпоративная сеть может объединять тысячи и десятки тысяч компьютеров, размещенных в различных странах и городах (в качестве примера можно привести сеть корпорации Microsoft – MicroSoft Network (MSN)).

Потребности формирования единого мирового информационного пространства привели к созданию глобальной компьютерной сети Интернет. В настоящее время на более чем 150 миллионах компьютеров, подключенных к Интернету, хранится громадный объем информации (сотни миллионов файлов, документов и так далее). Глобальная сеть Интернет привлекает пользователей своими информационными ресурсами и сервисами (услугами), которыми пользуется около миллиарда человек во всех странах мира (рис. 13).

 

Рис. 13. Структура глобальной сети Интернет

 

Интернет – это глобальная компьютерная сеть, объединяющая многие локальные, региональные и корпоративные сети и включающая сотни миллионов компьютеров.

В каждой такой локальной или корпоративной сети обычно имеется, по крайней мере, один компьютер, который имеет постоянное подключение к Интернету с помощью линии связи с высокой пропускной способностью (сервер Интернета). В качестве таких «магистральных» линий связи обычно используются оптоволоконные линии с пропускной способностью до 20 Гбит/с и более.



Потребность людей в росте общения, в расширении бизнеса и, как следствие, в новых методах управления вместе с развитием технологий привели к появлению Интернета. Люди связывают континенты информационными сетями уже почти полтора века. В 1858 г. была завершена прокладка первого трансатлантического кабеля. Эта новинка проработала всего несколько дней. Но созданный в 1866 году телефонный кабель Европа-Америка успешно функционировал почти 100 лет, став первой масштабной системой связи в истории человечества. После запуска в СССР первого спутника Интернет стал несимметричным ответом США на советскую космическую программу: в 1957 году создана Advanced Research Project Agency (ARPA), которая в 1967 году начала работу по созданию компьютерных сетей. В результате в 1965 году первые два компьютера были связаны по телефонной линии. В 1973 году сеть стала международной, к ней подключились университеты Англии и Норвегии. В 1990 году сеть появилась и в Советском Союзе. В 90-х годах сеть стала достоянием масс. С 14 сентября 1995 года сеть стала коммерческой. Тогда же родилась онлайновая индустрия развлечений.

Надежность функционирования глобальной сети обеспечивает большое количество линий связи между региональными сегментами сети. Например, российский региональный сегмент Интернета имеет несколько магистральных линий связи, соединяющих его с североамериканским, европейским и японским сегментами.

Основу, «каркас» Интернета составляют более 150 миллионов серверов, постоянно подключенных к сети, из которых в России насчитывается около 400 тысяч (на начало 2002 г.).

К серверам Интернета могут подключаться с помощью локальных сетей или коммутируемых телефонных линий сотни миллионов пользователей Интернета.

Интернет представляет собой среду с чрезвычайно широкими возможностями, среди которых можно отметить следующие:

- развлечения (игры, музыка, хобби);

- новости (интерактивные газеты, журналы, а также теле- и радиоприемники. Согласно статистике в Интернете представлено в 10 раз больше специализированных периодических изданий, чем в обычной среде);

- самостоятельное и дистанционное обучение (любая информация по образовательным программам, а также обучение в самых престижных вузах мира с получением стандартного диплома);

- общение (чаты, форумы, почта, интерактивные конференции).

Помимо получения чисто информационных услуг через Интернет можно совершать покупки и коммерческие сделки, оплачивать счета, заказывать билеты на различные виды транспорта, бронировать места в гостиницах и др.

Интернет представляет собой объединение более 40 тысяч различных локальных сетей, за что она и получила название Сеть сетей.Каждая локальная сеть называется узлом или сайтом,а юридическое лицо, обеспечивающее работу сайта, - провайдером.Сайт состоит из нескольких компьютеров - серверов,каждый из которых предназначен для хранения информации определенного типа и в определенном формате. Каждый сайт и сервер на сайте имеют уникальные имена, посредством которых они идентифицируются в Интернете.

Для подключения к Интернету пользователь должен заключить контракт на обслуживание с одним из провайдеров в его регионе. После этого любая работа в Интернете начинается с соединения с сайтом провайдера, связь с провайдером может быть организована или по коммутируемому телефонному каналу с помощью модема, или с помощью постоянно действующего выделенного канала. В первом случае соединение с провайдером выполняется с помощью модема и средств удаленного доступа, во втором - просто вызовом соответствующей программы для работы в Интернете. В обоих случаях после соединения с провайдером пользователь получает доступ ко всем сайтам и компьютерам в Интернете. Открывающиеся при этом перед пользователем возможности зависят от условий контракта, заключенного с провайдером.

Доступ к информационным ресурсам. Информационные ресурсы в Интернете различаются способом организации информации, методами работы с ней. Каждый вид информации хранится на серверах соответствующего типа, называемых по типу хранимой информации. Для каждой информационной системы существуют свои средства поиска необходимой информации во всему Интернету по ключевым словам. В Интернете имеются следующие информационные системы.

FTP-система(File Transfer Program). Эта система служит для пересылки файлов. Файлы становятся доступными для работы (чтения, исполнения) только после копирования на собственный компьютер пользователя. Хотя пересылка файлов может быть выполнена и с помощью WWW, FTP-системы продолжают оставаться весьма популярными ввиду их быстродействия и простоты использования.

FTP - это гигантское хранилище файлов различного типа - текстовых, электронных таблиц, программ, данных, графических, звуковых и др., хранящихся на РТР-серверах. FTP-серверы созданы почти всеми крупными фирмами.

При входе на FTP-сервернеобходимо зарегистрироваться, указав свой идентификатор и пароль. При отсутствии специальной регистрации на сервере рекомендуется в качестве идентификатора указывать слово Anonymous, а в качестве пароля - свой E-mail-адрес, но это не обязательно. При доступе к файлам категории Freeshare или Shareware подобная регистрация используется разработчиками сервера для учета и статистического анализа круга пользователей. Имена каталогов составляются произвольно, но существует ряд традиционно зарезервированных обозначений.

Все файлы на FTP-серверах делятся на текстовые (подготовленные в кодах ASCII) и двоичные (к ним относятся любые документы, подготовленные редакторами Windows). Файлы указанных групп пересылаются в сети разичным способом, поэтому программе копирования файлов ясно должен быть указан тип пересылаемого файла или установлен режим автоопределения. В последнем случае в одних программах считается, что только файлы с расширением ТХТ являются текстовыми, а в некоторых программах предусмотрена возможность задать список расширений текстовых файлов. Пересылка двоичного файла как текстового приведет к потере информации и ее искажению при пересылке. Если не известно, к какому виду относится файл, его следует пересылать как двоичный, хотя это и увеличивает время пересылки.

Новости (система телеконференций- UseNet Newsgroups).Необходимую информацию можно также получить из сборников часто задаваемых вопросов конференций UseNet. В хранилищах таких сборников можно найти определенную информацию. Эти сведения, как правило, более точные и полные, чем в общих каталогах. Телеконференции и новостные каналы служат для обсуждения сетевым обществом различных тем, поэтому здесь также имеет смысл искать необходимую информацию. По форме они напоминают доску объявлений. Конференции не являются надежным источником получения информации, поскольку заочно достаточно трудно судить об уровне компетентности респондентов. Эта служба содержит совокупность документов (статей), сгруппированных по определенным темам. В настоящее время имеется более 15 тыс. таких групп по самым различным темам. Пользователь, указав интересующие его темы (группы), может просматривать соответствующие документы и создавать свои. Новые документы могут адресоваться или всем членам группы, или авторам конкретных статей. Так как телеконференции сейчас используются для размещения различных тематических подборок (например экономического характера), участие в некоторых конференциях может потребовать дополнительной оплаты.

IRC и ICQ. Эти системы предоставляют возможность обмена информацией в режиме реального времени, т.е. текст, набираемый пользователем, немедленно воспроизводится на экране одного или сразу нескольких абонентов. В системе Windows эти функции выполняет приложение MS NetMeeting, позволяющее создавать общие рисунки и добавлять текст совместно с другими пользователями на удаленных рабочих станциях. При наличии у обоих абонентов звуковых карт и микрофонов с помощью MS NetMeeting можно организовать голосовой обмен между ними в режиме реального времени. Специальные средства телетрансляции дают возможность использовать Интернет для видеоконференций. Для организации интерактивного общения через WWW в настоящее время большое распространение получила система ICQ. Она вводит собственную адресацию абонентов, организует их удобный вызов и простой способ интерактивного общения.

Средства поиска, управления и контроля в Интернете включают в себя:

- системы поиска в WWW, предназначенные для поиска информации, организованной одним из перечисленных выше способов (WWW, FTP). Поиск может вестись по фрагментам текста, как содержащимся в именах файлов, так и являющимся ключевыми словами, отражающими смысловое содержание документа;

-Telnet - режим удаленного управления любым компьютером в Сети, используемый для запуска на сервере или на любом компьютере в Интернете необходимой программы (режим аналогичен средствам удаленного управления);

-служебная программа Ping, предназначенная для проверки качества связи с сервером;

-программы Whols и Finger, позволяющие найти координаты пользователей сети или определить пользователей, работающих в настоящий момент на конкретном хосте. Существуют также многочисленные системы «поиска людей», а точнее их электронных адресов, в Интернете.

Электронная почта.Самой распространенной стала технология компьютерного способа пересылки и обработки информационных сообщений, позволяющая поддерживать оперативную связь между руководством рабочих групп, сотрудниками, учеными, деловыми людьми, бизнесменами и всеми желающими. Такая технология получила название электронной почты.

Электронная почта - специальный пакет программ для хранения и пересылки сообщений между пользователями ЭВМ.

Посредством электронной почты реализуется служба безбумажных почтовых отношений. Она является системой сбора, регистрации, обработки и передачи любой информации (текстовых документов, изображений, цифровых данных, звукозаписи и т.д.) по сетям ЭВМ и выполняет такие функции, как редактирование документов перед передачей, их хранение в специальном банке, пересылка корреспонденции, проверка и исправление ошибок, возникающих при передаче, выдача подтверждения о получении корреспонденции адресатом, получение и хранение информации в собственном «почтовом ящике», просмотр полученной корреспонденции.

«Почтовый ящик» - специально организованный файл для хранения корреспонденции, состоящий из корзин отправления и получения.

Любой пользователь может обратиться к корзине получения другого пользователя и сбросить туда информацию. Но просмотреть ее он не может. Из корзины отправлений почтовый сервер забирает информацию для рассылки другим пользователям. Каждый почтовый ящик имеет сетевой адрес. Для пересылки корреспонденции можно установить связь с почтовым ящиком адресата в режиме on-line. Например, в сети Sprinmail пользователь, зарегистрировавшись и получив определенный статус, по телефонным каналам может входить в ближайший к нему узел сети и сообщаться с нужными абонентами в режиме on-line. Этот способ неудобен, так как необходимо ждать, пока будет включена ЭВМ получателя.

Более распространенным методом является выделение отдельных компьютеров в качестве почтовых отделений. Они называются почтовыми серверами.При этом все компьютеры получателей подключены к ближайшему почтовому серверу, получающему, хранящему и пересылающему дальше по сети почтовые отправления, пока они не дойдут до адресата. Отправка адресату осуществляется по мере его выхода на связь с ближайшим почтовым сервером в режиме off-line. Примером может служить сеть Relcom. Пользователь передает сообщение вместе с адресом по телефонному каналу через модем на ближайший почтовый север в режиме on-line. Сообщение регистрируется, ставится в очередь и по первому свободному каналу передается на следующий почтовый сервер, пока адресат не заберет его в свой почтовый ящик. Почтовые серверы реализуют следующие функции: обеспечение быстрой и качественной доставки информации, управление сеансом связи, проверку достоверности информации и корректировку ошибок, хранение информации «до востребования» и извещение пользователя о поступившей в его адрес корреспонденции, регистрацию и учет корреспонденции, проверку паролей при запросах корреспонденции, поддержку справочников с адресами пользователей.

Пересылка сообщений пользователю может выполняться в индивидуальном, групповом и общем режимах. При индивидуальном режимеадресатом является отдельный компьютер пользователя и корреспонденция содержит его адрес. При групповом режимекорреспонденция рассылается одновременно группе адресатов. Эта группа может быть сформирована по-разному. Почтовые серверы имеют средства распознавания группы. Например, в качестве адреса может быть указано: «Получить всем, интересующимся данной темой», или указан список рассылки. В общем режимекорреспонденция отправляется всем пользователям - владельцам почтовых ящиков. Посредством двух последних режимов можно организовать телеконференцию, электронные доски объявлений. Во избежание перегрузки почтовых ящиков в почтовых серверах хранятся справочники адресов, содержащих фильтры для групповых и общих сообщений.

Электронная почта поддерживает текстовые процессоры для просмотра и редактирования корреспонденции, информационно-поисковые системы для определения адресата, средства поддержания списка рассылаемой информации, средства предоставления расширенных видов услуг: факс, телекс и т.д. Электронная почта была реализована на файл-серверах. В настоящее время появились Microsoft Exchange, Notes Release 4.0, GroupWise XTD фирмы Novell, обеспечивающие высококачественный интерфейс с электронной почтой при использовании технологии «клиент-сервер». Последняя работает с платформами Macintosh, Unix, Windows NT, OS/2. Электронная почта может быть организована в локальной сети внутри предприятия для обеспечения внутреннего обмена информацией.

Отметим, что большинство глобальных сетей ЭВМ поддерживает электронную почту. В современных интегрированных пакетах используется объектно-ориентированная технология, а работа пользователя сводится к работе с меню. Почтовый ящик дополняется корзиной для мусора, куда пользователь может поместить ненужную корреспонденцию. Однако в случае необходимости он может оттуда ее забрать или окончательно выбросить.

Электронная почта применяется во всех деловых сферах, сокращая время организации сделок. Для расширения сферы услуг уже создана система взаимодействия электронной почты с сетями факсов и телексов. Кроме того, она проникает и на бытовой уровень, становясь средством общения соседей из одного дома, улицы, разных стран.

Кроме того, электронная почта может служить источником получения информации. С помощью определенной организации ее можно превратить в средство поиска информации. Прежде всего, можно предоставить свой адрес для получения подписки на новости. Каждый сервер новостей дает возможность предоставления анонса, доставляемого по e-mail. Это помогает сэкономить время на регулярном посещении новостных сайтов в поисках нужной информации.

World Wide Web (WWW) - Всемирная информационная паутина.Это динамично развивающаяся и популярная система с поистине неограниченными информационными возможностями, ее программное обеспечение столь универсально, что поддерживает работу практически со всеми другими ресурсами Интернета. С помощью WWW обеспечивается доступ почти ко всем ресурсам крупнейших библиотек мира, музейным коллекциям, музыкальным произведениям, периодическим изданиям, к законодательным правительственным постановлениям, справочникам и оперативным подборкам на любую тему (погода в любой точке земного шара, курсы валют, стоимость всевозможных услуг и товаров в любой стране и др.), аналитические обзоры. Из чисто информационной WWW все больше становится посреднической системой, обеспечивающей заключение контрактов, покупку товаров и расчеты по ним, бронирование билетов на транспорт, выбор и заказ экскурсионных маршрутов и тысячи других услуг. С помощью WWW проводится опрос общественного мнения, ведутся интерактивные диспуты с ведущими политиками, коммерсантами, деятелями культуры. Любая уважающая себя фирма имеет свою WWW-страницу, URL. Создать собственную WWW-страницу может каждый пользователь Интернета, что дает возможность любому жителю планеты представить себя в мировом информационном пространстве.

Специальные средства WWW обеспечивают взаимодействие между распределенными сетями, в том числе между сетями финансовых организаций. Существенное влияние система WWW оказала на структуру локальных сетей, которые стали организовываться на тех же принципах, что и WWW. Такие локальные сети называются Intranet-сетями.

Особенности WWW.Отметим основные особенности WWW, обеспечившие ее высокую популярность:

- гипертекстовая организация информационных элементов - страниц WWW. Это означает, что страница WWW может содержать специальные элементы - гипертекстовые ссылки,которые могут быть оформлены в форме специальным образом выделенного текста или рисунка;

- возможность включения в страницы WWW современных мультимедийных средств - графики, звука, анимации, а также других средств по художественному оформлению страниц - цветового и шрифтового оформления, широких возможностей по размещению информации на экране (макетированию страниц);

- возможность передачи на сайт владельца WWW-страницы различной информации;

- наличие бесплатного, хорошего и достаточно простого программного обеспечения, позволяющего непрофессиональному пользователю не только просматривать, но и самому создавать WWW-страницы;

- наличие хороших поисковых систем, позволяющих достаточно быстро отыскивать необходимую информацию; наличие удобных средств запоминания адресов размещения необходимой информации и ее последующее быстрое воспроизведение при необходимости;

- возможность быстрого перемещения назад-вперед по уже просмотренным страницам, отсутствие необходимости знать IP-адреса имен хостов, на которых размещается необходимая информация;

- наличие средств обеспечения надежности и конфиденциальности информационного обмена. Работа с ресурсами WWW обеспечивается специальными программами - браузерами. Экран браузеров включает следующие элементы: строку меню, содержащего обширный набор команд, и панель инструментальных кнопок; панель Избранное,содержащая часто используемые ссылки; поле адреса (или локатор), в котором задаются (или автоматически устанавливаются при щелчке по гипертекстовой ссылке) URL страницы, которую необходимо вывести на экран; окно, в которое загружаются WWW-страницы; строку состояния, в которой фиксируются действия браузера, выдаются подсказки и сообщения; индикаторы, размещаемые в строке состояния и информирующие, например, о ходе процесса чтения страницы с удаленного хоста, и др.

Далее названия кнопок и команд меню будут указываться в терминологии IE, хотя аналогичные элементы меню, кнопки и действия возможны и в Netscape Communicator.

Браузер может работать в Сети или автономно вне Интернета. Последнее требуется, например, для просмотра файлов в формате HTML, ранее запомненных на ПК или поставленных на CD-ROM. В автономном режиме браузер позволяет создавать собственные WWW-страницы, хотя для этих целей имеются и другие специальные средства.

Работа браузера всегда начинается с вывода на экран некоторой фиксированной страницы, называемой Домашней страницей. При инсталляции браузера в качестве домашней устанавливается WWW-страница разработчика. Однако командами меню с помощью соответствующего URL можно в качестве домашней задать произвольную страницу. Учитывая, что домашняя страница - это отправная точка для «путешествия» по сети WWW, можно в качестве домашней создать собственную страницу, содержащую гипертекстовые ссылки на часто используемые страницы и хранящуюся в виде файла формата HTML.

Поиск в WWW. Эффективная работа с WWW невозможна без мощных систем поиска необходимой информации. Для каждого вида ресурсов в Интернете (WWW, FTP) имеются свои системы поиска. Работа поисковых систем в WWW (машин поиска) базируется на поиске по ключевым словам. При этом возможно указание различных масок или шаблонов и логических функций поиска, в том числе:

- поиск документов, содержащих любое из заданных ключевых слов или фраз;

- поиск документов, содержащих несколько ключевых слов или фраз.

По способу организации поиска и предоставляемым возможностям все средства поиска условно можно разбить на следующие группы: каталоги и специализированные базы данных, поисковые и метапоисковые системы [30].

Каталоги в WWW аналогичны систематизированным библиотечным каталогам. Поиск по каталогам состоит в последовательном движении по иерархическому списку ссылок, называемых рубриками или категориями. На первой странице каталога содержатся ссылки на крупные темы, например: «Культура и искусство», «Медицина и здоровье», «Общество и политика», «Бизнес и экономика», «Развлечения» и др. Щелчок по соответствующей ссылке - категории - открывает страницу, содержащую ссылки, детализирующие выбранную тему - рубрику. Двигаясь вниз по детализирующим категориям, можно найти страницы с нужной информацией. На каждой странице, открываемой при движении по каталогу, тем или иным способом указывается последовательность просмотренных вложенных рубрик, например Деловой мир: Финансы: Аналитика и т.д.

Все каталоги создаются и поддерживаются в актуальном состоянии вручную соответствующими специалистами, аналогично тому, как библиографы составляют и поддерживают библиотечные каталоги. Описание ресурса выполняется либо составителями каталога, либо автором страницы. Благодаря этому содержание страниц, включенных в каталог, наиболее адекватно соответствует рубрике, к которой они отнесены. Но, учитывая скорость пополнения и изменения информации в Интернете, «ручной» способ ведения каталогов не позволяет адекватно отражать реальное состояние ресурсов Интернета на данную тему.

Имеются каталоги, включающие средства поиска по ключевым словам. При этом в некоторых каталогах по ключевым словам можно искать как категории, так и непосредственно страницы с информацией. Однако поиск ведется только среди страниц, на которые в данном каталоге имеются ссылки (в ресурсе каталога).

Поисковые машины(поисковые серверы, поисковые роботы).Типовая структура поисковой машины включает в себя базу данных и программу для ее обработки. Базы данных могут содержать страницы как зарезервированные владельцами ресурсов, так и обнаруженные средствами самой поисковой системы. Программа обработки данных состоит из сетевого агента, который обходит все предписанные серверы, анализирует содержимое web-страниц и выстраивает индексы или информацию о том, что и на какой странице было обнаружено, а также из определителя рейтинга, выполняющего сортировку ссылок, найденных по определенному ключевому слову. Полнотекстовые поисковые машины индексируют все найденные слова, за исключением малоинформативных. Каталог обычно имеет иерархическую структуру, и все его ресурсы классифицированы по темам. Эти серверы организованы по типу справочных систем, которые описывают ресурсы Интернета, применяя для этого возможные рубрикаторы. Здесь отбор информации производится жестче, нежели в поисковых машинах, поэтому соответствующие базы данных обычно меньше, но вероятность нахождения нужных сведений выше. Тематическую классификацию осуществляют либо авторы каталога (процесс идет качественно, но медленно), либо хозяева ресурсов (нельзя гарантировать соответствия ресурса разделу). При поиске ресурсов обычно информация сопровождается кратким описанием содержания. Главная особенность каталогов состоит в том, что при обращении к ним, как правило, знаешь, где расположено искомое, а поисковые серверы необходимы тогда, когда неизвестно ничего, кроме названия искомого.

Средства поиска этой группы дают возможность пользователю по определенным правилам сформулировать требования к необходимой ему информации (с помощью языка запросовсоздать запрос),после чего машина поиска автоматическипросматривает документы на контролируемых (индексируемых)ею сайтах и отбирает те из них, которые, «по мнению» поискового сервера, соответствуют сформулированным пользователем требованиям. В результате поиска создается одна или несколько страниц, содержащих ссылки на релевантные запросу документы. Для каждой такой ссылки обычно указываются также дата создания страницы, объем, степень соответствия релевантности запросу, фрагменты текста, характеризующие содержание страницы. Щелчок по такой ссылке позволяет загрузить нужную страницу. В случае очень большого количества найденных документов можно уточнить запрос и в соответствии с ним повторить поиск, но только среди отобранных страниц (такой поиск в разных машинах называется различным образом, но обычно это что-то вроде «искать в найденном»).В ряде поисковых систем можно тем или иным образом отметить ссылку на страницу, содержание которой в наибольшей степени удовлетворяет потребностям пользователя, и повторить поиск, потребовав «искать похожие».

Достоинство автоматизированного поиска состоит в том, что он обеспечивает просмотр в Интернете очень больших объемов информации. Однако необходимость точного описания запроса, адекватно отражающего информационные потребности пользователя, и большая сложность задачи автоматического определения степени соответствия просматриваемых роботом страниц запросу пользователя приводят к тому, что количество страниц, отобранных с первого захода, обычно или очень мало, или чрезмерно велико. В целом поиск с применением робота представляет собой итеративный процесс, в результате которого постепенно уточняется форма запроса.

Каждая поисковая система предусматривает формулировку запроса на одном из понятных ему языков. Для поиска по русским ключевым словам созданы специальные русскоязычные машины поиска. Некоторые из них одновременно допускают ввод английских слов.

При использовании различных машин поиска следует иметь в виду, что они принципиально отличаются количеством и составом просматриваемых сайтов, языком запросов, алгоритмами определения степени соответствия документа сформулированному запросу. В соответствии с этим количество и состав WWW-страниц, отобранных для одного и того же запроса разными машинами поиска, могут значительно различаться.

Способы формулировки запросов.Существуют четыре вида поиска: естественноязыковой (простой), строгий (с языком запросов), расширенный и специальный. При всех видах поиска в специальном поле Запросзадается фраза (ключевые слова) для поиска, возможно, содержащая управляющие символы (спецсимволы, операторы),посредством которых можно, в частности, уточнить допустимые сочетания ключевых слов. Далее информация, заданная в поле запроса, будет называться запросомили строкой запроса.

При естественноязыковом (простом) поискев строке запроса просто задается предложение или набор слов, наиболее полно отражающих предмет поиска. За очень небольшим исключением операторы при простом поиске не используются, а все специальные символы в строке запроса игнорируются.

При строгом поискев строке запросов, помимо ключевых слов, содержатся операторы,с помощью которых на специальном языке формулируются сложные запросы. При строгом поиске в запросе также могут быть указаны дополнительные, не связанные с ключевыми словами, требования к искомым документам. Такими требованиями, в частности, могут быть ограничение на дату создания искомых документов, указание области поиска документов (на конкретном сервере или на определенном множестве серверов) и др.

Строгий поиск позволяет формировать запросы большой сложности. В результате отсекаются посторонние документы, что сокращает затраты времени пользователя на их просмотр в списке найденных документов. Однако это требует от пользователя знания синтаксиса языка запросов.

Расширенный поискпредставляет собой разновидность простого поиска, в котором требования, дополняющие список ключевых слов, могут быть указаны путем заполнения полей в специальной форме. Это избавляет пользователя от необходимости знания языка запросов, однако при этом могут быть созданы только запросы «средней сложности», этого, тем не менее, в большинстве случаев вполне достаточно.

Специальный поисктакже сводится к заполнению полей. Он применяется для поиска сайтов организаций, издательств, обществ и др.

Знакомство с любой поисковой системой должно начинаться с изучения форм расширенного поиска или / и со знакомства с языком запросов. В домашней странице поисковых машин всегда имеются ссылки на подобную информацию. Хотя языки и формы запросов для различных систем несколько отличаются, но это различие незначительно, и после овладения одной системой переход к другой не вызывает особых трудностей.

Метапоисковые системы.Метапоисковые системы не содержат собственной базы данных - они производят опрос нескольких внешних поисковых машин, а затем самостоятельно анализируют результаты и в итоге выдают пользователю список ссылок. Как указывалось ранее, каждая поисковая система просматривает определенный набор «курируемых ею серверов» и отбирает документы в соответствии с присущими этой системе критериями отбора. В итоге поиск разными системами по одним и тем же ключевым словам дает различные результаты. Это привело к идее создания так называемых метапоисковых,или мультипоисковых,систем, которые сами ничего не ищут, но обращаются за помощью сразу к нескольким поисковым машинам. Каждая из метапоисковых систем имеет свой язык запросов. Сформулированный на этом языке запрос она переводит на язык запросов каждой используемой машины поиска. Далее результаты поиска всеми машинами объединяются и представляются в соответствующей форме. Естественно, что поиск с помощью метапоисковых систем занимает большее время в сравнении с обычными машинами поиска.

Наряду с метапоисковыми системами большое развитие получило «парное взаимодействие» между поисковыми машинами. Многие каталоги, имеющие примитивный язык запросов, транслируют его в запрос к одной из поисковых систем и ищут с ее помощью нужную информацию в собственных ресурсах.



<== предыдущая лекция | следующая лекция ==>
Шлюз - устройство соединения ЛВС с глобальной сетью. | Технологии разработки программного обеспечения (программирования)


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.007 сек.