русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Поиск в сети Интернет


Дата добавления: 2013-12-23; просмотров: 4531; Нарушение авторских прав


Интегрированные среды разработки программ.

Средства для создания приложений.

Средства для создания приложений - совокупность языков и систем программирования, а также различные программные комплексы для отладки и поддержки создаваемых программ.

Локальные средства разработки программ. Эти средства на рынке программных продуктов наиболее представительны и включают языки и системы программирования, а также инструментальную среду пользователя.

Инструментальная среда пользователя представлена специальными средствами, встроенными в пакеты прикладных программ, такими, как:

- библиотека функций, процедур, объектов и методов обработки;

- макрокоманды;

- клавишные макросы;

- языковые макросы;

- программные модули-вставки;

- конструкторы экранных форм и отчетов;

- генераторы приложений;

- языки запросов высокого уровня;

- языки манипулирования данными;

- конструкторы меню и многое другое.

Средства отладки и тестирования программ предназначены для подготовки разработанной программы к промышленной эксплуатации.

Дальнейшим развитием локальных средств разработки программ, которые объединяют набор средств для комплексного применения на всех технологических этапах создания программ, являются интегрированные программные среды разработчиков.

Основное назначение инструментария данного вида - повышение производительности труда программистов, автоматизация создания кодов программ, обеспечивающих интерфейс пользователя графического типа, разработка приложений для архитектуры клиент-сервер, запросов и отчетов.

 

В рекламе Интернета часто повторяются восторженные слова о том, что там можно найти любую информацию. Однако опытные обитатели Сети знают, что это далеко не так. Действительно, сегодня в Глобальной сети можно получить самые разнообразные сведения — от расписания авиарейсов и маршрутов движения транспорта до прогнозов погоды и рецептов экзотических блюд. Но если по содержанию («контенту») Сеть представляет собой буквально бездонный кладезь информации, то по способу организации — это, прошу прощения за грубое выражение, типичная помойка, где найти что-либо ценное представляется весьма проблематичным. Адреса Internet можно получить из различных источников. Это могут быть периодические издания, телевидение, радио, специализированные справочники и т.д. Но в этом как раз и состоит одна из главных проблем навигации в Internet. Не существует единого каталога, описывающего структуру сети и происходящие в ней изменения. Даже знаменитые "Желтые страницы Internet" содержат лишь несколько десятков тысяч адресов. А число компьютеров в сети ежедневно увеличивается. Кроме того, Internet просто перенасыщен информационным "мусором" – никому не нужными документами, покинутыми и не обновляемыми WWW-страницами.



За время существования Интернета предпринимались различные попытки организации поисковых средств. Наиболее удачных проекты появились в последнее 2-3 года.

Характер и качество предоставляемой поисковыми системами информации в значительной степени зависят от способа сбора данных в сети. Например, некоторые поисковые системы собирают информацию в Internet автоматически, с помощью специальных программ-роботов, посещающих WWW-страницы. Такие электронные поисковые системы называют индексными. При поиске профессиональной, узкоспециализированной информации эти системы приносят огромное количество "мусора", в котором достаточно долго приходится искать что-либо стоящее, а зачастую просмотреть все эти ссылки просто невозможно. Например, в любой электронной поисковой машине зарегистрированы тысячи документов, которые она предоставит в ответ на ключевое слово "Педагогика". По этой причине в Сети существуют специальные серверы, называемые поисковымикаталогами, где собираются и систематизируются ссылки на наиболее важные и качественные ресурсы Сети. Обращение к ним, как правило, оказывается более эффективным. Обычно при поиске информации начинают с одного из каталогов, вводя в строку запроса наиболее общее понятие – одно или два слова, характеризующих предмет поиска, например – "Повышение квалификации". Через некоторое время в ответ будет доставлено небольшое количество страниц, в которых упомянута эта фраза. Если количество полученных страниц слишком велико, можно переформулировать или конкретизировать запрос, например: "Повышение квалификации руководящих работников образования". Если просмотр результата поиска и видоизменение запроса в каталоге не привели к желаемому результату, то переходят к поиску с помощью индексной поисковой машины.

Для поиска можно воспользоваться многочисленными специализированными инструментами и средствами:

o Индексными поисковыми системами (indexing engines)

o Поисковыми каталогами (directories),

o Метапоисковыми системами

 

Для понимания различия между индексными поисковыми системами и поисковыми каталогами приведём пример книги. Чаще всего книга начинается с содержания и заканчивается алфавитным указателем. Несмотря на то, что они расположены в разных местах книги и выглядят совершенно по-разному, задача у них одна: помочь найти в книге нужный раздел. Содержание – это пример каталогизации. Алфавитный указатель – пример индексации. Читатель находит в указателе нужный термин и получает номер страницы, на которой он встречается. В Интернете каталоги и указатели различаются технологией подготовки. Над каталогами работают люди (модераторы), а поисковые индексные системы формируют базу данных автоматически.

Индексные поисковые системы (indexing engines)

Поисковые системы состоят из трех основных частей:

1. Робот (он же паук, червяк, гусеница, краулер, спайдер) - программа, которая посещает Web-страницы, считывает (индексирует) полностью или частично их содержимое и следует далее по ссылкам, найденным на данной странице. Через определенные периоды времени (например, каждый месяц) робот возвращается и индексирует страницу снова. Каждый поисковый механизм имеет собственный набор правил, определяющих, как собирать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют ссылки к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просматривать наиболее популярные страницы. Некоторые, например, индексируют каждое отдельное слово во встречающемся документе, в то время как другие индексируют только наиболее важных 100 слов в каждом, индексируют размер документа и число слов в нем, название, заголовки и подзаголовки и так далее.

2. База данных, которая содержит всю информацию, собираемую пауками.

3. Третья часть - это программа, которая в соответствии с запросом пользователя перебирает индексы поисковой системы в поисках информации, интересующей пользователя, и выдает ему найденные документы в порядке убывания релевантности (т.е. соответствия запросу). Когда кто-либо хочет найти информацию, доступную в Интернет, он посещает страницу поисковой системы и заполняет форму, детализирующую информацию, которая ему необходима. Здесь могут использоваться ключевые слова, даты и другие критерии. Критерии в форме поиска должны соответствовать критериям, используемым роботами при индексации информации, которую они нашли при перемещении по Сети. База данных отыскивает предмет запроса, основанный на информации, указанной в заполненной форме, и выводит соответствующие документы, подготовленные базой данных.

Различные поисковые системы используют различные алгоритмы ранжирования (сортировки полученных результатов), однако основные принципы определения ранжирования следующие:

1. Количество слов запроса в текстовом содержимом документа (т.е. в html-коде).

2. Тэги, в которых эти слова располагаются.

3. Местоположение искомых слов в документе.

4. Удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа.

5. Время - как долго страница находится в базе поискового сервера. Поначалу кажется, что это довольно бессмысленный принцип. Но, если задуматься, как много существует в Интернете сайтов, которые живут максимум месяц! Если же сайт существует довольно долго, это означает, что владелец весьма опытен в данной теме и пользователю больше подойдет сайт, который пару лет вещает миру о правилах поведения за столом, чем тот, который появился неделю назад с этой же темой.

6. Индекс цитируемости - как много ссылок на данную страницу ведет с других страниц, зарегистрированных в базе поисковика.

База данных выводит ранжированный подобным образом список документов с HTML и возвращает его человеку, сделавшему запрос. Различные поисковые механизмы также выбирают различные способы показа полученного списка - некоторые показывают только ссылки; другие выводят ссылки с первыми несколькими предложениями, содержащимися в документе или заголовок документа вместе с ссылкой. Когда Вы щелкаете на ссылке к одному из документов, который вас интересует, этот документ запрашивается у того сервера, на котором он находится.

Сравнительный обзор поисковых систем

Наиболее известными поисковыми машинами являются:

  • Alta Vista - http://www.altavista.com
  • Excite NetSearch - http://www.excite.com
  • HotBot - http://www.hotbot.com
  • Infoseek - http://guide.infoseek.com
  • Lycos - http://www.lycos.com
  • Magellan - http://www.mckinley.com
  • OpenText - http://www.opentext.com
  • WebCrawler - http://www.webcrawler.com

Lycos. В Lycos используется следующий механизм индексации:

· слова в <title> заголовке имеют высший приоритет;

· слова в начале страницы;

· слова в ссылках;

· если в его базе индекса есть сайты, ссылка с которых указывает на индексируемый документ - релевантность этого документа возрастает.

Как и большинство систем, Lycos дает возможность применять простой запрос и более изощренный метод поиска. В простом запросе в качестве поискового критерия вводится предложение на естественном языке, после чего Lycos производит нормализацию запроса, удаляя из него так называемые stop-слова, и только после этого приступает к его выполнению. Почти сразу выдается информация о количестве документов на каждое слово, а позже и список ссылок на формально релевантные документы. В списке против каждого документа указывается его мера близости запросу, количество слов из запроса, попавших в документ, и оценочная мера близости, которая может быть больше или меньше формально вычисленной. Пока нельзя вводить логические операторы в строке вместе с терминами, но использовать логику через систему меню Lycos позволяет. Такая возможность применяется для построения расширенной формы запроса, предназначенной для искушенных пользователей, уже научившихся работать с этим механизмом. Таким образом, видно, что Lycos относится к системе с языком запросов типа "Like this", но намечается его расширение и на другие способы организации поисковых предписаний.

AltaVista. Индексирование в этой системе осуществляется при помощи робота. При этом робот имеет следующие приоритеты:

o слова содержащиеся в теге <title> имеют высший приоритет; ключевые фразы в <Meta> тэгах;

o ключевые фразы, находящиеся в начале странички;

o ключевые фразы в ALT - ссылках

o ключевые фразы по количеству вхождений\присутствия слов\фраз;

Если тэгов на странице нет, использует первые 30 слов, которые индексирует и показывает вместо описания (tag description)

Наиболее интересная возможность AltaVista - это расширенный поиск. Здесь стоит сразу оговориться, что, в отличие от многих других систем AltaVista поддерживает одноместный оператор NOT. Кроме этого, имеется еще и оператор NEAR, который реализует возможность контекстного поиска, когда термины должны располагаться рядом в тексте документа. AltaVista разрешает поиск по ключевым фразам, при этом она имеет довольно большой фразеологический словарь. Кроме всего прочего, при поиске в AltaVista можно задать имя поля, где должно встретиться слово: гипертекстовая ссылка, applet, название образа, заголовок и ряд других полей. К сожалению, подробно процедура ранжирования в документации по системе не описана, но видно, что ранжирование применяется как при простом поиске, так и при расширенном запросе. Реально эту систему можно отнести к системе с расширенным булевым поиском.

Yahoo. Данная система появилась в Сети одной из первых, и сегодня Yahoo сотрудничает со многими производителями средств информационного поиска, а на различных ее серверах используется различное программное обеспечение. Язык Yahoo достаточно прост: все слова следует вводить через пробел, они соединяются связкой AND либо OR. При выдаче не указывается степень соответствия документа запросу, а только подчеркиваются слова из запроса, которые встретились в документе. При этом не производится нормализация лексики и не проводится анализ на "общие" слова. Хорошие результаты поиска получаются только тогда, когда пользователь знает, что в базе данных Yahoo информация есть наверняка. Ранжирование производится по числу терминов запроса в документе. Yahoo относится к классу простых традиционных систем с ограниченными возможностями поиска.

OpenText. Информационная система OpenText представляет собой самый коммерциализированный информационный продукт в Сети. Все описания больше похожи на рекламу, чем на информативное руководство по работе. Система позволяет провести поиск с использованием логических коннекторов, однако размер запроса ограничен тремя терминами или фразами. В данном случае речь идет о расширенном поиске. При выдаче результатов сообщается степень соответствия документа запросу и размер документа. Система позволяет также улучшить результаты поиска в стиле традиционного булевого поиска. OpenText можно было бы отнести к разряду традиционных информационно-поисковых систем, если бы не механизм ранжирования.

Infoseek. В этой системе индекс создает робот, но он индексирует не весь сайт, а только указанную страницу. При этом робот имеет такие приоритеты:

· слова в заголовке <title> имеют наивысший приоритет;

· слова в теге keywords, description и частота вхождений\повторений в самом тексте;

· при повторении одинаковых слов рядом выбрасывает из индекса

· Допускает до 1024 символов для тега keywords, 200 символов для тэга description;

· Если тэги не использовались, индексирует первые 200 слов на странице и использует как описание;

Система Infoseek обладает довольно развитым информационно-поисковым языком, позволяющим не просто указывать, какие термины должны встречаться в документах, но и своеобразно взвешивать их. Достигается это при помощи специальных знаков "+" - термин обязан быть в документе, и "-" - термин должен отсутствовать в документе. Кроме этого, Infoseek позволяет проводить то, что называется контекстным поиском. Это значит, что используя специальную форму запроса, можно потребовать последовательной совместной встречаемости слов. Также можно указать, что некоторые слова должны совместно встречаться не только в одном документе, а даже в отдельном параграфе или заголовке. Имеется возможность указания ключевых фраз, представляющих собой единое целое, вплоть до порядка слов. Ранжирование при выдаче осуществляется по числу терминов запроса в документе, по числу фраз запроса за вычетом общих слов. Все эти факторы используются как вложенные процедуры. Подводя краткое резюме, можно сказать, что Infoseek относится к традиционным системам с элементом взвешивания терминов при поиске.

WAIS. WAIS является одной из наиболее изощренных поисковых систем Internet. В ней не реализованы лишь поиск по нечетким множествам и вероятностный поиск. В отличие от многих поисковых машин, система позволяет строить не только вложенные булевые запросы, считать формальную релевантность по различным мерам близости, взвешивать термины запроса и документа, но и осуществлять коррекцию запроса по релевантности. Система также позволяет использовать усечения терминов, разбиение документов на поля и ведение распределенных индексов. Не случайно именно эта система была выбрана в качестве основной поисковой машины для реализации энциклопедии "Британика" на Internet.

Основные русскоязычные индексные поисковые службы:

  • http://www.rambler.ru - Рэмблер (лучший на сегодняшний день поисковый индекс)
  • http://www.yandex.ru - Яndex
  • http://www.aport.ru - АПОРТ!
  • http://www.google.ru – Русскоязычный Google
  • http://www.all.by – Поисковая система в Байнете
  • http://poisk.com - Поисковая система в Байнете

Приёмы поиска информации в индексированных поисковых системах

Все индексированные поисковые системы реализуют несколько алгоритмов поиска. К ним относятся:

Ø Простой поиск.При простом поиске в поле запроса вводится одно или несколько слов, которые могут характеризовать содержание документа. Если вводится несколько слов, то результат зависит от того, как эти слова введены, а это, в свою очередь, зависит от конкретной используемой системы. Приёмы простого поиска в разных поисковых системах, как правило, свои, и прежде чем ими пользоваться, желательно почитать инструкцию.

Ø Расширенный поиск. Под ним подразумевается запрос из группы слов. При расширенном поиске большинстве случаев разрешается связывать ключевые слова логическими операторами. AND (И), OR (ИЛИ), NOT (НЕ) и другими. основное достоинство расширенного поиска состоит в том, что записи ключевых слов и логических операторов в разных системах либо одинаковы, либо очень похожи. Поэтому, усвоив один раз приёмы расширенного поиска, можно ими пользоваться где угодно. Поиск операторов в документе не производится, они служат лишь инструкцией поисковой машине. Все операторы поисковой машины бинарные, то есть имеют левую и правую часть, каждая из которых также является запросом (по умолчанию состоящим из одного слова). Для изменения сферы действия операторов (группировки нескольких слов запроса в аргумент оператора) применяются скобки и кавычки.

Два запроса, соединенные оператором AND (логическое И) образуют сложный запрос, которому удовлетворяют только те документы, которые одновременно удовлетворяют обоим этим запросам. Иными словами, по запросу 'собака AND кошка' найдутся только те документы, которые содержат и слово 'собака', и слово 'кошка'.

Сложному запросу, состоящему из двух запросов, соединенных оператором OR (логическое ИЛИ) удовлетворяют все документы, удовлетворяющие хотя бы одному из этих двух запросов. По запросу 'собака OR кошка' найдутся документы, в которых есть хотя бы одно из слов 'собака' или 'кошка' (либо оба эти слова вместе).

Оператор NOT (логическое И-НЕ) образует запрос, которому отвечают документы, удовлетворяющие левой части запроса и не удовлетворяющие правой. Так, результатом поиска по запросу 'собака NOT кошка' будут все документы, в которых есть слово 'собака' и нет слова 'кошка'.

Если оператор явно не указан, используется оператор по умолчанию AND: находятся только документы, содержащие все слова запроса. Так, запрос 'информация технологии кредит' будет истолкован как 'информация AND технологии AND кредит'. На странице Расширенного поиска оператор по умолчанию можно заменить на OR (Искать слова запроса: хотя бы одно).

Каждый из операторов имеет сокращенное обозначение:

Оператор «Апорт» «Рамблер» «Яндекс»
И AND, &, + AND, & &&, +
ИЛИ OR, I OR, I I
НЕТ NOT, - NOT, ! ~~, -
Группировка ( ) ( ) ( )
Словосочетания “” Не применяется “”

Запрос из нескольких слов, перемежающихся операторами, будет истолкован в соответствии с их приоритетом. Операторы AND и NOT традиционно имеют более высокий приоритет, поэтому запрос из нескольких слов при обработке сначала группируется по операторам AND и NOT, и лишь потом по операторам OR. Изменить порядок группировки можно использованием скобок. Часть запроса, заключенная в скобки, сама является запросом, и на нее распространяются правила языка построения запросов. Использование скобок позволяет строить вложенные запросы и передавать их операторам в качестве аргументов, а также перекрывать приоритеты операторов, принятые по умолчанию.

Если запрос без скобок 'машина самолет | аэродром' эквивалентен запросу 'машина AND самолет OR аэродром' и, в соответствии с приоритетами операторов, означает "найти документы, содержащие либо слова 'машина' и 'самолет', либо слово аэродром, то запрос со скобками 'машина (самолет | аэродром)' равносилен запросу 'машина AND (самолет OR аэродром)', что означает "найти документы, содержащие слово 'машина' и одно из слов 'самолет' или 'аэродром'".

Роль прописных букв имеет большое значение. Возможно, для многих это удивительно, но «хлеб»=«ХЛЕБ», а «ХЛЕБ»¹ «хлеб». Именно так и обстоит дело в большинстве поисковых систем. Общее правило такое: если клиент ввёл строчные символы, то разыскиваются как строчные, так и прописные символы, но если клиент использовал прописные буквы, то ищется точное совпадение только с прописными буквами. Классический пример - Красная Шапочка. Если их ввести именно так, то будут разысканы только документы, в которых встречается указанное сочетание. Однако если ключевые слова записать как красная шапочка, то будет разыскано больше документов. Через сито отбора пройдут все документы, в которых встречаются сочетания красная шапочка, Красная шапочка, красная Шапочка, Красная Шапочка. Поэтому не стоит злоупотреблять применение прописных букв в запросе и использовать их лишь тогда, когда абсолютно уверены в результате.

Некоторые поисковые системы имеют при себе и каталог. Соответственно, индексы для самой поисковой системы добываются роботом, а каталог пополняется модераторами системы.

Ниже приведены настройки расширенного поиска в поисковых системах Google, Yandex, Rambler, All.by, Poisk.com

Рис.1 Расширенный поиск в Google

 

Рис.2 Расширенный поиск в Yandex

Найдется все.
 

 

Числа: 519 623 серверов, 62 261 109 документов, 1 008 Гб English

 

 
  Пример: международное студенческое удостоверение ISIC  
Я ищу:
   

 

 

 

· Подписка · Помощь  
  Словарный фильтр    
    Искать в страницах, содержащих, или не содержащих указанные слова. обязательно желательно исключить операторы все формы точная форма в предложении в документе во фразе в заголовке в аннотации в ссылке в адресе обязательно желательно исключить все формы точная форма в предложении в документе во фразе в заголовке в аннотации в ссылке в адресе  
  Дата    
    Искать за указанный период времени любой последние 2 недели последний месяц последние 3 месяца последние 6 месяцев последний год последние 2 года После До Января Февраля Марта Апреля Мая Июня Июля Августа Сентября Октября Ноября Декабря  
  Сайт/вершина    
    Искать только на данном сайте Примеры: www.yandex.ru, www.yandex.ru/skazki/  
    Исключить из поиска страницы данного сайта    
  Ссылка    
    Искать страницы со ссылками на данный URL Примеры: www.yandex.ru, www.yandex.ru/skazki/  
    Исключить из поиска страницы cо ссылкой на данный URL    
  Изображение    
    Искать страницы, содержашие файл картинки Примеры: lenin, flowers.gif  
    Искать страницы, содержащие картинку с подписью Примеры: цветы, ленин  
  Специальные объекты    
    Искать страницы, содержащие файлы объектов данного типа скрипт (script) апплет (applet) объект (object) стиль (style) Примеры: clock.class, default.css, home.js  
  Язык    
    Искать на языке любом русском (кириллица) не русском (латиница)  
  Формат выдачи    
    Количество ссылок на странице и длина описания. 10 25 50 100  
         
         
   
 
 

 

 
         
  Расширенный поиск в Интернете  
Что искать     Помощь

 

 
Поиск по тексту:
  всего документа названия (<title>) заголовков (<h1> - <h5>)
Искать слова запроса:
  все ("и") хотя бы одно ("или") точную фразу
Расстояние между словами запроса:
  не ограничивать ограничивать
Исключить документы, содержащие следующие слова:
   
   
Язык документа:
  любой русский английский
Дата документа (в формате "24/04/2001"):
 
начиная с   по  

 

Искать документы только на следующих сайтах:
   
  Примеры: science.rambler.ru, www.lenta.ru, www.hosting.ua/~name (после "/" - только каталоги, начинающиеся c "~" !)

 

 
Вывод результатов  
Сортировать: сайты по релевантности страницы по релевантности страницы по дате (сначала новые) страницы по дате (сначала старые) Выдавать: по 15 по 30 по 50 Форма вывода: стандартная краткая детальная
     
Связанные запросы:
показывать отдельной колонкой показывать внизу страницы
     

 

 
     
                           

Рис.3 Расширенный поиск в поисковой системе Рамблер

 


 

Рис.4 Расширенный поиск в поисковой системеAll.by

 

Рис.5 Расширенный поиск в поисковой системе Poisk.com

 

Ø Контекстный поиск.Это очень полезный вид поиска, который реализован не во всех поисковых системах. Системы, которые его поддерживают, следует ценить особо. При контекстном поиске требуется точное совпадение фразы. При контекстном поиске ключевая фраза должна быть заключена в кавычки. Слова запроса, заключенного в двойные кавычки, ищутся в документах именно в том порядке и в тех формах, в которых они встретились в запросе.
Таким образом, двойные кавычки можно использовать и просто для поиска слова в заданной форме. Например, запросу 'самолет "заправился" посадка' удовлетворяет документ, содержащий текст '... самолет совершил посадку и заправился ...', и не удовлетворяет документ, содержащий '.. самолет совершил посадку, чтобы заправиться ...'.

 

Ø Специальный поиск. С помощью команд специального поиска разыскивают дополнительную информацию. Например, такие команды позволяют определить, как часто в Сети встречаются гиперссылки, указывающие на какой-либо ресурс, с их помощью можно найти ключевые слова, входящие в заголовки Web-страниц и т.п. Как правило, команды специального поиска в различных поисковых системах свои.

Каждая Web-страница имеет служебные поля в своём заголовке, а также специальные элементы, например, гиперссылки. В таблице представлены команды специального поиска поисковой системы Yandex.

Команда Описание Пример Пояснение
$title (Выражение) Поиск ключевых слов, указанных в выражении, выполняется только в заголовках Web-страниц $title (Космос) Разыскиваются только Web-страницы, в заголовках которых имеется слово Космос (рис.5.)
#keywords=(выражение) Поиск среди ключевых слов, заданных автором Web-страницы #keywords=(новости) Автор Web-страницы может сам задать ключевые слова, описывающие его материал. При просмотре в броузере мы их не видим, но они учитываются поисковыми системами при индексации.
#abstract=(выражение) Поиск в аннотации Web-страницы #abstract=(собака çкот) Автор Web-страницы может дать ей краткую аннотацию, которая на экране не отображается, но учитывается поисковыми системами при индексации
#image=(выражение) Поиск файлов иллюстраций по их имени #image=(cat.*) Если заранее неизвестно, какое расширение может иметь имя файла, применяют шаблон *(Рис.6)
#hint=(выражение) Поиск слов в альтернативном тексте иллюстраций #hint=(Учёба ç Учение) Автор может связать с иллюстрацией текст, называемый альтернативным. Он воспроизводится, если графика в броузере отключена или при наведении курсора мыши на рисунок
#link=”URL-адрес” Поиск Web-страниц, содержащих гиперссылки на заданный URL-адрес #link=”www.bn.by” Выявляются Web-страницы, на которых имеются гиперссылки на указанный URL-адрес (Рис.7)

Рис.6 Результат поиска по команде $title (Космос)

Рис.7 Результат поиска по команде #image=(cat.*)


Рис.8 Результат поиска по команде #link=”www.bn.by”

Формы поиска

 

Поиск необходимой информации может выполняться среди различных типов данных:

o Web-страниц

o Рисунков

o Видеофайлов

o Звуковых файлов

o Товары

o Энциклопедии и т.д.

Самое большое количество форм поддерживает поисковая система Aport, а система Rambler разыскивает только тексты.

Обычно, перед тем как давать задание на поиск, следует включить переключатель, соответствующий типу разыскиваемых данных.

Рис.9. Выбор формы поиска на «Яндексе»

Рис.10. Выбор формы поиска на «Апорт»

Рис.11. Выбор формы поиска на «Рамблер»

Поисковые каталоги (directories)

Каталог, как правило, имеет иерархическую структуру, и все его ресурсы классифицированы по темам. Каталоги обычно разбиваются на тематические разделы, которые, в свою очередь, делятся на более мелкие т.д. В каталогах предусмотрен механизм поиска, который позволяет по ключевым словам найти ресурс, содержащийся в каталоге. Здесь отбор информации производится гораздо жестче, нежели в поисковых машинах, поэтому соответствующие базы данных обычно во много раз меньше, но вероятность нахождения нужных сведений с их помощью значительно выше.

Поскольку регистрация в каталогах полностью зависит от людей - модераторов данной системы, то кроме ссылки на нужный ресурс скорее всего получают краткое описание его содержания. Впрочем, многие каталоги включают в себя и внутренние поисковые машины. Главная особенность каталогов состоит в том, что при обращении к ним, как правило, знаешь, что искать, и в итоге узнаешь лишь то, где расположено искомое, а поисковые серверы необходимы тогда, когда не знаешь ничего, кроме того, как называется искомое и к какой области относится.

Пользователь ищет информацию в каталогах двумя способами:

o переходя по иерархической системе подкаталогов

o используя внутреннюю поисковую систему

Основные русскоязычные каталоги следующие:

  • http://www.ru
  • http://weblist.ru - Веблист
  • http://www.rocit.ru – Вирталог
  • http://www.list.ru – List.ru

Рис.12. Поисковой каталог Вирталог

Рис.13. Результаты поиска патчей и кодов к компьютерным играм


Рис.14. Поисковой каталог Веблист

Рис.15 Самый большой русскоязычный поисковой каталог List.ru



<== предыдущая лекция | следующая лекция ==>
ИНСТРУМЕНТАРИЙ ТЕХНОЛОГИИ ПРОГРАММИРОВАНИЯ. | Метапоисковые системы


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.162 сек.