Все три поисковых движка предлагают возможность поиска изображений. По существу, занимающиеся поиском изображений поисковые движки ограничиваются в своей работе только изображениями (при ползании по сети, поиске и выдаче результатов). Это файлы в формате GIF, TIF, JPG и в прочих похожих форматах. На рис. 2.29 показан движок поиска изображений из Bing.
Рис. 2.29. Результаты поиска изображений из Bing
Движки поиска изображений выполняют удивительно большое количество запросов. Согласно данным comScore, в октябре 2008 г. было выполнено более 1 млрд поисков изображений, т. е. более 8,3 % от всех выполненных в этом месяце операций поиска. Похожие данные от Nielsen Online говорят о том, что в январе 2009 г. поиск изображений составил 6,0 % всего поиска. Однако поскольку изображение – это двоичный файл, то он не может быть легко интерпретирован пауком поискового движка.
Поисковый движок должен полагаться на окружающий изображение текст, атрибут alt тега img и название файла изображения. Оптимизация поиска изображений – это отдельная наука, которую мы более подробно обсудим в разд. "Оптимизация поиска изображений" главы 8.
Движки поиска видео фокусируются на нахождении определенных типов файлов, таких как MPEG, AVI и др. На рис. 2.30 показаны результаты поиска видео на YouTube.
Рис. 2.30. Результаты поиска видео на YouTube
Движки поиска видео также выполняют очень большое количество операций поиска. Данные Hitwise и comScore показывают, что в октябре 2008 г. было выполнено примерно 125 млн операций поиска видео в основных поисковых движках (например, http://video.google.com, http://video.yahoo.com иhttp://video.bing.com), а затем это число взлетает до 2,6 млрд операций (если включить сюда результаты YouTube (http://www.youtube.com), который стал поисковым движком № 2 в Интернете).
Можно получить значительное количество трафика, если оптимизироваться под движки поиска видео и участвовать в их работе. Повторимся еще раз: это двоичные файлы и поисковый движок не может с легкостью сказать, что именно находится внутри них.
Это означает, что оптимизация ограничивается данными в заголовке видео и данными на окружающей его web-странице. Мы будем более подробно обсуждать оптимизацию поиска видео в разд. "Прочие: мобильный поиск, а также поиск видео/мультимедиа” главы 8.
Однако все поисковые движки вкладывают деньги в технологии анализа изображений и видео (чтобы извлекать как можно больше информации). Например, технология оптического распознавания символов (optical character recognition, OCR) используется для поиска текста внутри изображений, а для анализа видеоконтента применяются другие передовые технологии. Анализ телесных тонов используется для выявления порнографии и распознавания лиц. Применение этих технологий пока находится в зародыше, но оно со временем будет быстро расширяться.