русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Движки будут улучшать просмотр


Дата добавления: 2014-03-21; просмотров: 586; Нарушение авторских прав


Еще больше просматриваемого контента и типов контента

Акцент в этой книге делался в основном на снабжении пауков поисковых движков текстовым контентом, семантически размеченным при помощи HTML. Однако поскольку поисковые алгоритмы развиваются в отношении способов сбора, анализа и интерпретации данных, то в страницы результатов поиска все больше и больше интегрируются документы менее доступных типов (такие, как мультимедиа, контент за формами, отсканированные исторические документы). Эта тенденция усиливается также повышением спроса и доступности.

Поисковые движки преодолевают некоторые традиционные ограничения просмотра. Они начинают работать с контентом таких типов, которые они раньше не могли просматривать и интерпретировать. Например, отчеты середины 2008 г. показывают, что Google находит ссылки внутри JavaScript (http://www.seomoz.org/ugc/new-reality-google-follows-links-in-javascript-4930). Безусловно, существует вероятность того, что поисковые движки могут начать выполнять JavaScript (чтобы найти тот контент, который в него встроен).

В июне 2008 г. компания Google объявила, что она просматривает и индексирует Flash-контент (http://googlewebmastercentral.blogspot.com/2008/06/improved-flash-indexing.html). В частности, в этом объявлении было указано, что Google находит внутри контента текст и ссылки. Однако при работе с Flash-контентом были и существенные ограничения. Например, просмотр работал только с такими реализациями Flash, которые не используют внешних вызовов JavaScript (а это делают многие системы на основе Flash).

Возможно, самой большой проблемой является тот факт, что Flash, по сути, имеет нетекстовый характер. По существу он похож на любой другой формат видео, в котором нет необходимости использовать много текста, а это ограничивает количество интерпретируемого поисковыми движками материала. И пусть это шаг вперед, но, тем не менее, людям, которые хотят создавать сайты полностью на Flash, придется немного подождать (до тех пор, пока социальные сигналы не станут более сильным фактором поискового ранжирования).



Еще одно серьезное историческое ограничение поисковых движков – это работа с формами. Классический пример – поле поискового запроса на web-сайте. Поисковому движку нет смысла вводить случайные поисковые запросы только для того, чтобы увидеть, какие результаты выдаст поиск. Однако есть и другие примеры использования более простых форм, таких как заполняемая пользователем форма для получения доступа к скачиванию некой статьи.

Поисковый движок может попробовать заполнить такую форму (возможно, в соответствии с неким протоколом, в котором определены правила для получения доступа к подобному контенту так, чтобы он мог проиндексировать его и включить в свои результаты поиска). В настоящее время подобными простыми формами изолировано огромное количество ценного контента, а определение такого протокола вполне реально (хотя это нелегкая задача). Компания Google утверждает, что она имеет эту возможность, но будет использовать ее только на очень важных и недоступных сайтах (http://googlewebmastercentral.blogspot.com/2008/04/crawling-through-html-forms.html). Существуют и другие сценарии, когда поисковые движки предоставляют формы и получают доступ к недоступному контенту.



<== предыдущая лекция | следующая лекция ==>
Доминирование компании Google | Мультимедиа становится индексируемой


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.006 сек.