Управление контентом при помощи куки-файлов и идентификаторов сеансов
Иногда вы хотите более тщательно указать, что увидит робот поискового движка при посещении вашего сайта. Обычно представители поисковых движков называют такую практику показа разного контента пользователям и паукам клоакингом (маскировкой) и считают ее спамерской.
Однако у этой концепции есть вполне законные применения, которые не вводят в заблуждение поисковые движки и не имеют злоумышленных намерений. Этот раздел посвящен таким методам (с использованием куки-файлов и идентификаторов сеансов).
Куки-файл – это небольшой текстовый файл, который web-сайт может оставить на жестком диске посетителя. Такой файл помогает следить за этим человеком. Именно благодаря куки-файлам сайт Amazon.com помнит ваше имя пользователя и вам не нужно регистрироваться под вашей учетной записью в Hotmail при каждом запуске браузера. Данные в куки-файле – это обычно небольшое количество информации о том, когда вы в последний раз обращались к сайту, идентификационный номер, а также (возможно) информация о вашем посещении (рис. 6.28).
Рис. 6.28. Использование куки-файлов для хранения данных
Разработчики web-сайтов могут при помощи куки-файлов запоминать посетителей для их отслеживания или для того, чтобы показывать пользователю различную информацию (зависящую от их действий или предпочтений). Обычно они используются для запоминания имени пользователя, обслуживания корзины покупателя, а также для отслеживания ранее просмотренного контента. Например, если вы зарегистрировали учетную запись в SEOmoz, то на странице вашей учетной записи My Account получите опции по способам просмотра блога (которые будут запомнены для вашего следующего посещения).
Идентификаторы сеансов по функциональности практически идентичны куки-файлам, с одной только разницей – после закрытия вашего браузера (или его перезапуска) информация идентификатора сеанса (обычно) больше не хранится на вашем жестком диске (рис. 6.29). Web-сайт, с которым вы взаимодействовали, может помнить ваши данные или действия, но не может получить с вашего компьютера идентификатор сеанса (который не сохраняется, поскольку по умолчанию срок действия идентификатора сеанса истекает при закрытии браузера). По существу, идентификаторы сеансов более похожи на временные куки-файлы (хотя вы увидите далее, что имеются варианты управления этим поведением).
Рис. 6.29. Как используются идентификаторы сеансов
Несмотря на то, что формально идентификатор сеанса является просто формой куки-файла без даты истечения срока действия, можно настроить для идентификатора сеанса и дату истечения срока действия (на десятилетия вперед). В этом смысле он практически идентичен куки-файлу. Однако идентификатор сеанса имеет важную особенность – он часто передается в строке URL, что может создать серьезные проблемы для поисковых движков (т. к. каждый запрос выдает уникальный URL с дублированным контентом). Простое решение – это использовать тег canonical (который мы обсудим далее в разд. "Поставка контента и управление поисковыми пауками" этой главы), чтобы дать понять поисковым движкам, чтобы они игнорировали идентификаторы сеансов.