русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Особенности поиска информации в Яndex


Дата добавления: 2014-11-27; просмотров: 7184; Нарушение авторских прав


обеспечивает создание архивного файла или наоборот, распаковку файлов архивов типа *.zip. Если отметить несколько файлов, то такая команда выполнит операцию архивировать/разархивировать над всеми из них. Если передать такие архивный файлы в раздел операционной системы Windows, то после перезагрузки эти файлы можно обслуживать, например, программой WinZip.

Лабораторная работа. Поиск информации в WWW

Требования к содержанию, оформлению и порядку выполнения

Перед выполнением лабораторной работы необходимо создать папку. В эту папку в ходе выполнения работы необходимо сохранять требуемые Web-страницы.

Лабораторную работу необходимо выполнять согласно своему варианту. Вариант определяем по номеру монитора за которым Вы работаете (нечетные номера– первый вариант, чётные – второй).

Перед выполнением лабораторной работы изучите теоретическую часть, ознакомьтесь со страницами описания поиска в поисковых системах Яndex (http://www.yandex.ru ), Rambler (http://www.rambler.ru), АПОРТ (http://www.aport.ru). Задания лабораторной работы необходимо выполнять последовательно, при необходимости сохраняя требуемые Web-страницы поиска в свою папку.

 

Теоретическая часть

Особенности поиска информации в Яndex

Яndex поисковая система позволяющая организовать поиск прежде всего в российском Интернете и в доменных зонах республик бывшего СССР. Хотя с помощью Яndex можно легко отыскать и западный сайт, если на него ведет прямая ссылка с од­ной из отечественных страничек.

Яndex приспособлен к особенностям русского языка, в отличие от западных поисковых систем, осуществляющих поиск в российском Интернете. Это проявляется в первую очередь в том, что Яndex различает словоформы, т.е. умеет находить заданные слова независимо от формы, в которой они употребляются в документах. Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос «идти», то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т.д.



Яndex, в отличие от большинства поисковых машин, различает регистр букв. Если Вы наберете ключевое слово со строчной буквы, то будут найдены документы, содержащие это слово со строчной так и с прописной буквой. Но если написать слово со строчной буквы, то Яndex найдет страницы, которые содержат искомое слово именно с прописной буквой.

В Яndex при желании можно определить область поиска, используя переключатель внизу строки поиска (Рис. 1).

Рис. 1. Строка поиска в поисковой системе Яndex.

То есть, Яndex можно указать, где именно искать нужную вам информацию. Помимо категории Везде предлагаются следующие варианты:

• Каталог

• Новости

• Маркет (товары)

• Энциклопедии

• Картинки

Кроме простого запроса в Яndex можно осуществить сложный поиск с использованием языка поисковых запросов. Причем язык поисковых запросов у Яndex достаточно многогранен. В Яndex, кроме использования общепринятых операторов логических отношений, можно указывать расстояния между словами (расстояние в словах, предложениях, абзацах), назначать словам весовых коэффициентов, ограничивать поиск только фрагментом документа и т.д.

Таблица 1.

Синтаксис языка запросов Яndex.

Синтаксис Что означает оператор Пример запроса
пробел или & логическое И (в пределах предложения) лечебная физкультура
&& логическое И (в пределах документа) рецепты && (плавленый сыр)
| логическое ИЛИ фото | фотография | снимок | фотоизображение
+ обязательное наличие слова в найденном документе (работает также в применении к стоп-словам) +быть или +не быть
( ) группирование слов (технология | изготовление) (сыра | творога)
~ бинарный оператор И НЕ (в пределах предложения) банки ~ закон
~~ или - бинарный оператор И НЕ (в пределах документа) путеводитель по парижу ~~ (агентство | тур)
! точная форма !идти
/(n m) расстояние в словах (-назад +вперед) поставщики /2 кофе музыкальное /(-2 4) образование вакансии ~ /+1 студентов
" " поиск фразы "красная шапочка" (эквивалентно красная /+1 шапочка)
&&/(n m) расстояние в предложениях (-назад +вперед) банк && /1 налоги
$title (выражение) поиск в заголовке $title (CompTek)
$anchor (выражение) поиск в тексте ссылок $anchor (CompTek | Dialogic)
#keywords=(выражение) поиск в ключевых словах #keywords=(поисковая система)
#abstract=(выражение) поиск в описании #abstract=(искалка | поиск)
#image="значение" поиск файла изображения #image="tort*"
#hint=(выражение) поиск в подписях к изображениям #hint=(lenin | ленин)
#url="значение" поиск на заданном сайте (странице) #url="www.comptek.ru*"
#link="значение" поиск ссылок на заданный URL #link="www.yandex.ru*"
#mime="значение" поиск в документах данного (pdf или rtf) типа #mime="pdf"

 

 

Рассмотрим подробнее основные операторы поиска Яndex.

Логическое AND (И). Этот оператор подразумевает, что в искомом документе должны обязательно содержаться все слова, которые оператор разделяет в запросе. В принципе логическому «И» соответствует простой пробел между ключевыми словами запроса, но использование + или &, позволяет ужесточить критерии запроса. Например, при запросе «лечебная & физкультура» (эквивалентно запросу «+лечебная +физкультура»), результатом поиска будет список документов, в которых в одном предложении содержатся и слово «лечебная», и слово «физкультура».

Заметим, что двойное & (&&) обозначает логическое «И» в пределах документа, а знак + (как впрочем, и -) в запросе размешаются следующим образом: перед любым из них ставится пробел, а вот с последующим словом они должны находиться в непосредственном соседстве.

Логический оператор NOT (HE)(«без»). Подразумевает, что выбраны будут все до­кументы, содержащие слово перед этим оператором, но исключая содержащие слова после него. Обозначается – (~~) (в пределах документа) и ~ (в пределах предложения). Данный оператор идеальный инструмент для сужения поля поиска. Например, по запросу «Москва ~ город» будут найдены все документы, содержащие слово «Москва», рядом с которым (в пределах предложения) нет слова «город».

Логическая оператор OR (ИЛИ), обозначается |.Указывает на то, что вдокументе должно находиться хотя бы одно сло­во из тех, которые разделяет этот оператор. Например: «расписание график | перечень».

Как и во многих других поисковых машинах в Яndex для построения сложных поисковых выражений можно использовать скобки.

Например: (фотографии | фотокарточки) +(реставрация | восстановление).

Точная формаобозначается знаком !. Используется, когда нужно ограничиться лишь одной, конкретной формой данного слова или фразы.

Например, по запросу: «!идти» уже не будут выдаваться документы, в которых содержится словоформа «шел».

Кроме того, Яndex, в отличие от многих других поисковых систем, позволяет осуществлять поиск по точной фразе. Для этого достаточно заключить слова фразы в кавычки. Например, по запросу «информационные технологии», на момент написания этих строк, Яndex выдавал 2 858 973, а по запросу «”информационная технология”» – всего 65 420.

Наконец, при поиске в Яndex, используется ряд дополнительных символов, позволяющих определять, на каком расстоянии друг от друга должны распола­гаться в тексте странички слова, включенные в запрос:

/n где n равно количеству слов-«разделителей»

Так, по запросу: «персональный /3 компьютер»будут найдены все странички, в тексте которых встречаются слова «пер­сональный» и «компьютер», отделенные друг от друга не более чем тремя словами.

Число n можно также дополнить знаками + и - , в зависимости от того, в ка­кую сторону будет вестись отсчет слов-разделителей (вперед и назад соответст­венно). В общем виде ограничение по расстоянию задается при помощи пунктуации вида /(n m), где n минимальное, а m максимально допустимое расстояние. Так запрос «музыкальное /(-2 4) образование» означает, что слово «музыкальное» должно находиться от слова «образование» в интервале расстояний от 2 слов слева до 4 слов справа.

Когда знаки ограничения по расстоянию стоят после двойных операторов, то употребленные там числа - это расстояние не в словах, а в предложениях. Запрос «банк && /1 налоги» означает, что слово «налоги» должно находиться в том же самом, либо в соседнем со словом «банк» предложении.

Остальные операторы позволяют осуществить специальный поиск, в том числе поиск в заголовках страниц, поиск в текстах ссылок, поиск в ключевых словах, поиск в описании, поиск в подписях к изображениям, поиск на заданном сайте (странице), поиск ссылок на заданный URL и т.д.

Расширенный поиск

Сложный поиск в Яndex можно выполнить и без знания операторов. Для этого в Яndex предусмотрена специальная поисковая форма «Расширенный поиск». Воспользоваться ей можно, щелкнув по крестику под кнопкой Найти строки поиска, или набрав в адресной строке браузера следующий URL: http://www.yandex.ru/advanced.html

Форма «расширенного поиска» представляет даже более широкие возмож­ности, чем использование стандартных операторов языка запросов. С её помощью можно уточнить взаиморасположение искомых слов, указать область поиска в документе, ограничить круг поиска страницами, созданными или изме­ненными в пределах заданного временного интервала, уточнить язык докумен­та, исключить из просматриваемой зоны отдельные странички или сайты, или наоборот, искать заданный текст только в их границах.

Рис. 2. Фрагмент страницы расширенного поиска в поисковой системе Яndex.



<== предыдущая лекция | следующая лекция ==>
Vi file_one | Поисковая система Rambler


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.165 сек.