русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Инструменты (или средства навигации) информационного поиска Интернет-ресурсов


Дата добавления: 2013-12-23; просмотров: 2619; Нарушение авторских прав


Следовательно, выработка навыков профессионального поиска - актуальная задача сегодняшнего дня.

По некоторым данным там содержится около 8 миллиардов документов. И этот гигантский массив непрерывно пополняется новыми данными и постоянно изменяется.

Поиск нужной информации в сети Интернет является не простой задачей, так как глобальная паутина содержит огромное количество документов.

Язык запросов рубрикатора Aport

Язык запросов поисковой системы Yandex

Стратегия информационного поиска

Характеристика мета-поисковых систем

Инструменты и методы информационного поиска Интернет-ресурсов

1.Инструменты и методы информационного поиска Интернет-ресурсов

Все заметнее становится применение Интернет в образовательной и научной деятельности, для проведения исследований в различных областях знания. Это могут быть академические разработки, бизнес-проекты или углубленное самообразование. Поэтому важно иметь систематизированные знания по поиску информации в Интернет, овладеть навыками использования общедоступных и профессиональных коммерческих баз данных, иметь четкое представление об электронных библиотеках, знать методы описания и цитирования ресурсов Сети в собственных трудах.

Вот почему в настоящее время написано немало статей, посвященных ознакомлению с инструментами и методами информационного поиска нужных данных в компьютерных сетях, к которым относят, например: различные текстовые документы, иллюстрации, анимации, аудио – и видеофрагменты и др.

СЛАЙД Существует две составные части, входящие в понятие эффективный поиск в глобальной сети Интернет - а) инструменты и б) методы информационного поиска.



СЛАЙД К инструментам или средствам навигации условно относят справочники и поисковые системы, которые в свою очередь входят в общее понятие специальная поисковая служба (сервис).

Как справочники, так и поисковые системы внешне очень похожи, поскольку каждый справочник, как правило, обладает собственной поисковой системой, а каждая поисковая система – собственным справочником. Отличие в том, что принципы их работы базируются на абсолютно разных подходах и технологиях.

СЛАЙД Справочники ресурсов (каталоги или рубрикаторы)представляют собой электронные справочники, которые имеют четкую иерархическую или логико-тематическую структуру, во многом напоминающую структуру систематического каталога библиотеки.

Работа со справочниками позволяет ориентироваться в ресурсах Интернет в пределах отдельных отраслей знания, углубляясь от общего к частному, меняя иерархические ветви, и т.д.

К таким справочникам относятся: СЛАЙД

· Yahoo!(www.yahoo.com) - международный;

· СЛАЙД Open Directory Project (dmoz.org) - международный;

· СЛАЙД About(www.about.com) - международный;

· СЛАЙД Апорт(www.aport.ru) – российская разработка;

· СЛАЙД List.ru(list.mail.ru) – российская разработка;

· СЛАЙД Weblist(www.weblist.ru) – российская разработка;

· Иван Сусанин (www.susanin.net) – российская разработка;

· СЛАЙД Улитка (www.ulitka.ru) – российская разработка.

СЛАЙДОсобенность справочников заключается в том, что они сделаны вручную. Редакционные коллегии регулярно просматривают содержимое вновь появившихся серверов и следят за изменениями на уже существующих. Выявленные данные анализируются и заносятся в разделы справочника в соответствии с принятой классификацией. Разделы и сами новые серверы снабжаются краткой аннотацией о характере имеющихся в них данных.

По причине огромной трудоемкости такой работы, справочники отражают лишь незначительную часть ресурсов в Интернете, в первую очередь наиболее заметные сайты.

СЛАЙДОсновными параметрами, характеризующими достоинства справочников являются:

§ объем, который определяет степень надежности справочника.

От него зависит уровень доверия пользователей, питающих к конкретному каталогу. Здесь важно то, насколько оперативно появляются ссылки на новые сайты, исправляются или удаляются ссылки на устаревшие ресурсы;

§ научность и логичность применяемой схемы классификации, способствующая степени простоты, с которой пользователи могут находить требуемые сведения;

§ перекрестность ссылок (структуры), позволяющих выявлять информацию, используя разные подходы (например, территориальный или отраслевой).

СЛАЙД Справочники предназначены для решения трех типовых задач:

1. Ориентация в незнакомой отрасли знания.

2. Разыскания крупных объектов, например, серверы целых организаций или значительных проектов.

3. Получение готового перечня ресурсов, имеющих размытый поисковый образ, например, клиник пластической хирургии, библиотек определенного типа, транспортных расписаний или сайтов различных политических партий.

Одним словом, справочники предназначены лишь для получения общих сведений по тематике, и никогда – детальных данных (например, название и несколько строк аннотации).

СЛАЙД Поисковые системы.В основу поисковых систем заложены совершенно иные технологические принципы, то есть обеспечивать детальное разыскание информации в глобальной сети на основе учета (индексирования) всего содержания максимально возможного числа веб-страниц.

Поисковые системы состоят из двух базовых компонентов.

Первый компонент представляет собой программу-робот, задача которого путешествовать с сервера на сервер, находить там новые или изменившиеся документы и скачивать их на главный компьютер системы. Программа самостоятельно направляется по указанным ссылкам, находит новые документы и ссылки в них, после чего процесс повторяется вновь.

Второй компонент обрабатывает (индексирует) выявленные документы. При этом учитывается все содержание страниц, включая текст, иллюстрации, аудио- и видеофайлы и пр. Индексации подвергаются все слова в документе, что и дает возможность использовать поисковые системы для детального поиска по самой узкой тематике. Образуемые гигантские индексные файлы, хранящие информацию о том, какое слово, сколько раз, в каком документе и на каком сервере употребляется, и составляет базу данных, к которой происходит обращение пользователей, вводящих в строку запроса сочетание ключевых слов.

 

СЛАЙДК основными параметрам поисковых систем относятся:

§ объем индексных файлов, который устанавливает широту охвата материала и определяется числом проиндексированных документов. Сейчас эта цифра колеблется для продвинутых поисковых систем в пределах от 2 до 4 миллиардов;

§ степень оперативности обновления базы данных, характеризующий степень соответствия индексного файла поисковой системы реальному местоположению документов на сайтах. В настоящее время этот параметр колеблется от двух недель до полутора месяцев;

§ возможность для составления запроса (т.е. поискового механизма), где каждая машина имеет свою собственную лексику, которая по-разному позволяет детализировать поисковое предписание;

§ наличие модуля ранжирования результатов поиска. Создание таких модулей – целая область программирования, в которой конкурируют сложнейшие алгоритмы, созданные разными компаниями;

§ простата интерфейса и наличие дополнительных сервисных функций, например, способность выделять все документы с определенного сайта, сужение критериев в ходе поиска, нахождения документов «по образцу» и т.д.

К наиболее авторитетным поисковым системам в настоящее время относятся СЛАЙД:

· Google (www.gooogle.com);

· СЛАЙД Fast Search (www.alltheweb.com);

· СЛАЙД Alta Vista (www.altavista.com);

· СЛАЙД Яндекс (www.yandex.ru) – российская;

· СЛАЙД Rambler (www.rambler.ru) – российская;

· СЛАЙД Апорт (www.aport.ru) – российская.

 

Практически все всемирно известные как поисковые системы, так и справочники в настоящее время превратились во внушительные информационные корпорации с многомиллионными доходами. Заработав авторитет наиболее посещаемых мест в сети, они предоставляют свои страницы для размещения рекламной информации.

Постепенно поисковые сервера превращаются в многофункциональные порталы, в которых поисковая система остается главной приманкой для пользователя.

Кроме того, они предоставляют пользователям бесплатную электронную почту, возможность бесплатно размещать собственные страницы, сведения о погоде, текущих новостей, биржевые котировки, карты местности и т.д.

 



<== предыдущая лекция | следующая лекция ==>
Принципов уголовного процесса | Характеристика мета-поисковых систем


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.149 сек.