русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Поиск статей в группах новостей. Поиск файлов. Поиск адресной информации организаций и людей.


Дата добавления: 2013-12-24; просмотров: 2492; Нарушение авторских прав


Метапоисковые системы (поисковые службы). Определение и основные возможности программ ускоренного поиска (поисковых агентов).

Поисковые машины (автоматические индексы). Простой и сложный режимы поиска. Обобщенные возможности формирования запроса с использованием операторов. Режим сложного (расширенного) поиска. Представление и обработка результатов поиска.

Классификация средств поиска. Приемы работы с тематическими каталогами.

Обобщенная структура и основные компоненты информационно-поисковых систем для WWW. Понятие индекса. Особенности процедуры индексирования.

Рассмотрим постановку задачи поиска в общем виде. Для этого нам необходимо ответить на три вопроса: что искать, то есть, какие источники информации, где искать (места размещение этих источников) и как искать (какие инструменты для этого использовать).

 

Выделим основные источники информации, представленные в Интернете. Это документы WWW, статьи в группах новостей и списках рассылки, файлы в библиотеках файлов, справочники адресной информации организаций и людей (электронная почта, адрес, телефон), статьи в тематических базах данных, энциклопедиях. Обратите внимание на то, что перечисленный список не претендует на полноту.

 

Теперь отвечаем на вопрос, где эти источники информации размещаются. Это такие популярные ресурсы Интернет, как WWW, группы новостей, списки рассылки и FTP-серверы.

 

Безусловно, можно искать нужные источники информации вручную, узнавать адреса из специализированных журналов по информатике и Интернету, использовать специальные бумажные справочники с классифицированными по категориям адресами. Однако для такого изменчивого пространства как Интернет необходимо научиться пользоваться специальными инструментами, цель которых – собирать данные об информационных ресурсах и предоставлять пользователям услугу быстрого поиска.



 

Таким образом, мы подходим к понятию автономного инструмента поиска – информационно-поисковой системы. Введем определение.

 

ИПС (информационно-поисковая система) – это система, обеспечивающая поиск и отбор необходимых данных в специальной базе с описаниями источников информации (индексе) на основе информационно-поискового языка и соответствующих правил поиска.

 

Главной задачей любой ИПС является поиск информации релевантной информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу, и не найти ничего лишнего. Поэтому вводится качественная характеристика процедуры поиска – релевантность.

 

Релевантность – это соответствие результатов поиска сформулированному запросу.

 

Далее мы будем, в основном, рассматривать ИПС для всемирной паутины (WWW). Основными показателями ИПС для WWW являются пространственный масштаб и специализация. По пространственному масштабу ИПС можно разделить на локальные, глобальные, региональные и специализированные. Локальные поисковые системы могут быть разработаны для быстрого поиска страниц в масштабе отдельного сервера. Региональные ИПС описывают информационные ресурсы определенного региона, например, русскоязычные страницы в Интернете. Глобальные поисковые системы в отличие от локальных стремятся объять необъятное – по возможности наиболее полно описать ресурсы всего информационного пространства сети Интернет.

 

Кроме того, ИПС также могут специализироваться по поиску различных источников информации, например, документов WWW, файлов, адресов и т.д.

Итак, обобщенная технология поиска состоит из следующих этапов:

Пользователь формулирует запрос

Система проводит поиск документов (или их поисковых образов)

Пользователь получает результат (сведения о документах)

Пользователь совершенствует или реформирует запрос

Организация нового поиска...

В общем случае, можно выделить следующие поисковые инструменты для WWW: поисковые системы, метапоисковые системы и программы ускоренного поиска. Центральное место по праву принадлежит поисковым системам, которые в свою очередь подразделяются на каталоги, автоматические индексы (поисковые машины) и каталоги-индексы. Только поисковые системы почти в полном объеме обладают возможностями и свойствами ИПС.

 

Каталог – поисковая система с классифицированным по темам списком аннотаций со ссылками на web-ресурсы. Классификация, как правило, проводится людьми.

 

Поисковая машина – поисковая система с формируемой роботом базой данных, содержащей информацию об информационных ресурсах.

 

Метапоисковая система – система, не имеющая своего индекса, способная послать запросы пользователя одновременно нескольким поисковым серверам, затем объединить полученные результаты и представить их пользователю в виде документа со ссылками.

 

Программа ускоренного поиска – это программа с возможностями метапоисковой системы, устанавливаемая на локальном компьютере.

 

Принципиальным отличием метапоисковых систем и программ ускоренного поиска от ИПС является отсутствие своего собственного индекса. Зато они превосходно умеют использовать результаты работы других поисковых систем.

 

Рассмотрим особенности систем-каталогов.

 

Поиск в каталоге очень удобен и проводится посредством последовательного уточнения тем. Тем не менее, каталоги поддерживают возможность быстрого поиска определенной категории или страницы по ключевым словам с помощью локальной поисковой машины. База данных ссылок (индекс) каталога обычно имеет ограниченный объем, заполняется вручную персоналом каталога. Некоторые каталоги используют автоматическое обновление индекса.

 

Результат поиска в каталоге представляется в виде списка, состоящего из краткого описания (аннотации) документов с гипертекстовой ссылкой на первоисточник.

 

Среди самых популярных зарубежных каталогов можно упомянуть:

 

Yahoo (www.yahoo.com),

 

Magellan (www.mckinley.com),

Российские каталоги:

@Rus (www.atrus.ru)

Weblist (www.weblist.ru)

Созвездие интернет (www.stars.ru).

Отличительной чертой поисковых машин является тот факт, что база данных, содержащая информацию об Web-страницах, статьях Usenet и т.д., формируется программой-роботом.

 

Поиск в такой системе проводится по запросу, составляемому пользователем, состоящему из набора ключевых слов или фразы, заключенной в кавычки. Индекс формируется и поддерживается в актуальном состоянии роботами-индексировщиками. Для сужения области поиска возможна сортировка содержимого индекса по категориям.

 

Как правило, поисковые машины поддерживают два режима: режим простого поиска и режим расширенного поиска. Рассмотрим обобщенные возможности формирования запроса в режиме простого поиска. Можно просто вводить через пробел одно или несколько слов; поиск слов со всевозможными окончаниями моделируется символом * в конце слова. Многие системы позволяют искать словосочетания или фразу, для этого необходимо ее заключить в кавычки. Возможно обязательное включение или исключение определенных слов.

 

Основная проблема поиска по примитивно составленному запросу (в виде перечисления ключевых слов) заключается в том, что поисковая машина найдет все страницы, на которых указанные слова встречаются в любой части документа. Как правило, количество найденных страниц будет слишком велико. Для улучшения качества поиска в режиме простого поиска допустимо использование логических операторов и операторов, позволяющих ограничить область поиска, а также выбор определенной категории документов из представленного списка.

 

В качестве операторов, устанавливающих отношения между ключевыми словами, большинство поисковых систем используют следующие:

 

AND (И) & – обязательное присутствие всех ключевых слов;

 

OR (ИЛИ) | – присутствие хотя бы одного из ключевых слов;

 

NOT (НЕ) ! – отсутствие ключевого слова;

 

NEAR (ОКОЛО) ~ – определенный интервал между ключевыми словами.

 

Многие поисковые системы включают в свой язык составления запросов специальные операторы, позволяющие проводить поиск в определенных зонах документа, например, в его заголовке, или искать документ по известной части его адреса. Интересной возможностью является поиск документов в сети, ссылающиеся на страницу с указанным вами адресом (URL). Таким образом, можно найти в сети страницы, на которых есть ссылки на ваш Web-сайт. Некоторые системы позволят ограничить область поиска внутри указанного домена.

 

В качестве дополнительных специальных операторов можно выделить:

 

3 Операторы поиска документов с определенным графическим файлом;

 

3 Операторы ограничения по дате искомых страниц;

 

3 Операторы близости между словами;

 

3 Операторы учета словоформы;

 

3 Операторы сортировки результатов (по релевантности, свежести, старости).

 

Следует заметить, что, к великому сожалению, на сегодняшний день не существует стандарта на количество и синтаксис поддерживаемых операторов для различных поисковых систем. Попытки разработать стандарт на синтаксис поддерживаемых операторов предпринимаются, поэтому есть надежда на то, что разработчики поисковых систем позаботятся об удобстве пользователей. На данном этапе развития средств поиска, пользователь, обращаясь к определенной поисковой системе, непременно должен в первую очередь ознакомиться с ее правилами составления запросов. Как правило, на домашней странице будет обязательно присутствовать ссылка Помощь (Help), по которой вы перейдете к справочной информации.

 

Посмотрите, какой вид имеет оператор поиска в заголовке в поисковых системах Altavista, Yandex, Aport:

 

Altavista: title:"текст"

 

Yandex: $title (выражение)

 

Aport: title=

 

Режим расширенного или детального запроса в разных системах реализован индивидуально, но чаще всего это бланк, в котором упомянутые операторы и ключевые элементы реализуются простой установкой соответствующих флажков или выбором параметров из списка.

 

Рассмотрим способы представления результатов поиска в поисковых машинах. Чаще всего количество найденных документов превышает несколько десятков, а в отдельных случаях может достигать сотен тысяч! Поэтому в качестве формы выдачи составляется список документов по 5-10-15 единиц на странице с возможностью перехода к следующей порции внизу страницы. Обязательно указывается заголовок и URL(адрес) найденного документа, иногда система указывает в процентах степень релевантности документа.

 

В описании документа чаще всего содержится несколько первых предложений или выдержки из текста документа с выделением ключевых слов. Как правило, указана дата обновления (проверки) документа, его размер в килобайтах, некоторые системы определяют язык документа и его кодировку (для русскоязычных документов).

 

Что можно делать с полученными результатами? Если название и описание документа соответствует вашим требованиям, можно немедленно перейти к его первоисточнику по ссылке. Это удобнее делать в новом окне, чтобы иметь возможность далее анализировать результаты выдачи. Многие поисковые системы позволяют проводить поиск в найденных документах, причем вы можете уточнить ваш запрос введением дополнительных терминов. Если интеллектуальность системы высока, вам могут предложить услугу поиска похожих документов. Для этого вы выбираете особо понравившийся документ и указываете его системе в качестве образца для подражания. Однако, автоматизация определение похожести – весьма нетривиальная задача, и зачастую эта функция работает неадекватно вашим надеждам. Некоторые поисковики позволяют провести пересортировку результатов. Для экономии вашего времени можно сохранить результаты поиска в виде файла на локальном диске для последующего изучения в автономном режиме.

 

На слайде представлены адреса наиболее популярных поисковых машин за рубежом и в России.

 

Зарубежные поисковые машины:

Google www.google.com

Altavista www.altavista.com

 

Excite www.excite.com

HotBot www.hotbot.com

Nothern Light www.northernlight.com

 

Go (Infoseek) www.go.com (infoseek.com)

 

Fast www.alltheweb.com

 

Российские поисковые машины:

 

Яndex www.yandex.ru (или www.ya.ru)

 

Рэмблер www.rambler.ru

 

Апорт www.aport.ru

 

Белорусские поисковые системы:

 

Система 09 www.09.open.by

 

Поисковая система Unibel http://search.unibel.by

 

Система *.BY http://search.promedia.minsk.by/

 

Регистр белорусских WWW-ресурсов Зубр www.zubr.com

 

Белорусский интенет-каталог Акавiта http://akavita.kryvia.net/

 

Каталог "Коллекция ссылок web-ресурсов в и о Беларуси" http://www.ac.by/country/.

 

www.poisk.com

Теперь познакомимся с инструментами поиска, которые не формируют собственный индекс, но умеют использовать возможности других поисковых систем. Это метапоисковые системы (поисковые службы) – системы, способные послать запросы пользователя одновременно нескольким поисковым серверам, затем объединить полученные результаты и представить их пользователю в виде документа со ссылками.

 

Здесь приведены адреса известных метапоисковых систем.

 

MetaCrawler www.metacrawler.com

SavvySearch www.savvysearch.com

 

Наконец, рассмотрим последний в списке инструмент поиска – программы ускоренного поиска.

 

Программа ускоренного поиска – это программа, устанавливаемая на компьютере пользователя и способная:

 

3 посылать запросы к нескольким поисковым серверам;

 

3 сортировать результаты поиска по релевантности;

 

3 удалять дубликаты;

 

3 проверять наличие документов в сети.

 

Далее приведены адреса разработчиков и название популярных программ ускоренного поиска.

 

WebFerret, NewsFerret, … www.ferretsoft.com

 

Inforia Quest 99: http://www.inforia.com/quest

 

Subject Search Spider (SSSpider) – www.kryltech.com.

 

После подробного изучения основных возможностей инструментов обратимся к проблеме эффективности поиска. Основными параметрами эффективности поиска является полнота как отношение числа найденных документов к общему числу релевантных документов (то есть найдены все документы, соответствующие запросу), и точность поиска – отношение числа релевантных документов к общему числу полученных документов (то есть не найдено ничего лишнего, не относящегося к делу). Это и означает понятие релевантности. Немаловажное значение имеет актуальность ссылок на документы, те есть существование в настоящий момент найденных документов в сети, и скорость поиска.

 

Таким образом, можно выделить следующие факторы, влияющие на эффективность поиска:

 

3 Свойства и возможности поисковой системы.

 

3 Качество формулировки запроса пользователем.

 

Каким образом можно оценить качество поискового инструмента? Поисковые системы обычно сравнивают по следующим параметрам:

 

3 Количество проиндексированных страниц (объем индекса).

 

3 Количество поддерживаемых операторов.

 

3 Стандартный оператор, объединяющий несколько ключевых слов. Если стандартным оператором является оператор И, поисковая машина автоматически будет искать документы, на которых обязательно будут присутствовать все введенные ключевые слова. В противном случае (оператор ИЛИ) будут найдены документы со всеми ключевыми словами и с каждым по отдельности

 

3 Поиск точной фразы.

 

3 Поиск слов с различными окончаниями.

 

3 Учет словоформ. В случае автоматического режима учета словоформ система будет искать в документах слово со всеми его изменениями.

 

Далее, продолжаем список:

 

3 Чувствительность к заглавной букве. Если система не различает заглавные и строчные буквы, результаты поиска будут менее качественными.

 

3 Поиск мультимедийных файлов.

 

3 Форма представления результатов.

 

3 Сортировка по категориям

 

3 Период обновления индекса. Этот показатель влияет на такой параметр как актуальность найденных ссылок. Чем чаще обновляется индекс, тем реже в результатах поиска будут встречаться устаревшие ссылки.

 

3 Задержка перед пропиской. Данный параметр указывает на временной интервал перед занесением описания Web-страницы в индекс после просьбы ее автора.

38. Параметры эффективности поиска: полнота, точность, актуальность, скорость. Факторы, влияющие на эффективность поиска. Сравнительные возможности поисковых систем. Планирование поисковой процедуры. Приемы эффективного поиска.

После подробного изучения основных возможностей инструментов обратимся к проблеме эффективности поиска. Основными параметрами эффективности поиска является полнота как отношение числа найденных документов к общему числу релевантных документов (то есть найдены все документы, соответствующие запросу), и точность поиска – отношение числа релевантных документов к общему числу полученных документов (то есть не найдено ничего лишнего, не относящегося к делу). Это и означает понятие релевантности. Немаловажное значение имеет актуальность ссылок на документы, те есть существование в настоящий момент найденных документов в сети, и скорость поиска.

Таким образом, можно выделить следующие факторы, влияющие на эффективность поиска:

3 Свойства и возможности поисковой системы.

3 Качество формулировки запроса пользователем.

Каким образом можно оценить качество поискового инструмента? Поисковые системы обычно сравнивают по следующим параметрам:

3 Количество проиндексированных страниц (объем индекса).

3 Количество поддерживаемых операторов.

3 Стандартный оператор, объединяющий несколько ключевых слов. Если стандартным оператором является оператор И, поисковая машина автоматически будет искать документы, на которых обязательно будут присутствовать все введенные ключевые слова. В противном случае (оператор ИЛИ) будут найдены документы со всеми ключевыми словами и с каждым по отдельности

3 Поиск точной фразы.

3 Поиск слов с различными окончаниями.

3 Учет словоформ. В случае автоматического режима учета словоформ система будет искать в документах слово со всеми его изменениями.

Далее, продолжаем список:

3 Чувствительность к заглавной букве. Если система не различает заглавные и строчные буквы, результаты поиска будут менее качественными.

3 Поиск мультимедийных файлов.

3 Форма представления результатов.

3 Сортировка по категориям

3 Период обновления индекса. Этот показатель влияет на такой параметр как актуальность найденных ссылок. Чем чаще обновляется индекс, тем реже в результатах поиска будут встречаться устаревшие ссылки.

3 Задержка перед пропиской. Данный параметр указывает на временной интервал перед занесением описания Web-страницы в индекс после просьбы ее автора.

Теперь рассмотрим, как лучше подготовиться пользователю к составлению запроса. Прежде всего, необходимо провести всесторонний лексический анализ информации, которую вы собираетесь искать. Затем необходимо составить набор ключевых слов (при необходимости, на нескольких языках) в виде отдельных терминов, словосочетаний, профессиональной лексики и клише.

Далее следует технологический этап поисковой процедуры, в котором необходимо исследовать различные поисковые инструменты. Для каждого выбранного инструмента проводятся:

3 Тестовые запросы из 1-2 ключевых слов или фразы.

3 Анализ количественного отклика.

3 Корректировка запроса по релевантности отклика.

Исходя из вышеизложенного, можно выделить следующие приемы эффективного поиска:

3 Поиск общей информации в каталогах. В каталогах вы, как правило, обязательно выйдете на специализированные сервера в искомой области.

3 Поиск узкоспециальной информации в поисковых машинах. Для проведения более обширного поиска ограниченного числа ссылок в каталогах явно недостаточно. Кроме того, узкоспециальная информация в каталогах может просто отсутствовать. Поэтому необходимо проводить поиск в поисковых машинах, обладающих индексами большого объема.

3 Использование операторов или бланка расширенного запроса для сужения области поиска. Для проведения качественного поиска необходимо ознакомиться с языком запросов конкретной поисковой машины. Эффективным и простым способом решения проблемы составления качественного запроса является использование режима расширенного запроса.

3 Использование функции поиска в найденном. Большинство поисковых систем поддерживают возможность поиска внутри полученных результатов. Как правило, для этого нужно включить специальный флажок Искать в найденном и ввести дополнительные слова для повторного поиска среди найденных по запросу страниц.

3 Использование поиска похожих документов.

3 Использование метапоисковых систем и программ ускоренного поиска информации. Для получения общего обзора документов целесообразно использовать возможности метапоисковых систем или программ ускоренного поиска. Напоминаем, данные инструменты поиска отправляют ваш запрос сразу нескольким поисковым системам и от каждой системы получают несколько самых релевантных ссылок.

3 Просмотр раздела Ссылки на специализированных сайтах. Авторы многих специализированных Web-узлов накапливают свои коллекции ссылок по тематике сайта. Зачастую вы зайдете в этих коллекциях много полезных источников, сэкономив время, затрачиваемое на самостоятельный поиск с использованием рассмотренных выше инструментов.

3 Поиск ответов на вопросы в группах новостей. При желании можно обратиться с конкретным вопросом о помощи в специализированную группу новостей. Найти нужную группу можно, используя специальные инструменты поиска, которые мы рассмотрим далее.

3 Подписка на специализированные списки рассылки. Подписавшись на специализированный список рассылки, вы сможете получать по электронной почте свежую информацию по вашей тематике, а также задавать вопросы вашим коллегам-подписчикам.

 

Обсудим проблему поиска такого источника информации, как статьи в группах новостей. Инструментами поиска в данном случае могут являться рассмотренные поисковые машины WWW, которые индексируют не только пространство WWW, но и статьи в телеконференциях и имеют специальный режим поиска именно в этом ресурсе. Поиск в группах новостей поддерживает, например, поисковый сервер Altavistа. Следует отметить, что поисковые системы WWW весьма оперативно индексируют группы новостей и содержат информацию о статьях, реально существующих в сети. Для поиска в архивах новостей существую специализированные системы, самой известной из которых является система Deja (www.deja.com). Эта система позволяет проводить как поиск отдельных статей, содержащих введенный термин, так и поиск определенных групп новостей, посвященных обсуждению заданной темы. Можно зарегистрироваться в Deja и подписаться на определенные группы новостей.

 

Теперь рассмотрим инструменты, позволяющие проводить поиск файлов. Многие поисковые системы WWW стали оказывать услугу поиска мультимедийных файлов (Altavista, Aport,… ). Для этого вовсе нет необходимости знать специальные операторы, а достаточно перейти с домашней страницы по ссылкам Картинки (Images), MP3/Audio или Video к специальному режиму поиска. Поиск проводится по возможному имени файла или по тексту в комментарии к ссылке на мультимедийный файл. Вы можете спрогнозировать имя файла, например, файл с изображением орла может называться eagle.gif. Или догадаться, что фото Билла Гейтса будет иметь соответствующую подпись.

 

Что касается поиска программного обеспечения, во всемирной паутине существуют поисковые Web-серверы с коллекциями условно-бесплатного ПО, некоторые из них специализируются на поиск программного обеспечения для Интернета или для конкретной операционной системы. Эти системы в конечном итоге приведут вас к конкретному серверу, с которого и можно скачать искомый программный продукт. Следует упомянуть серверы Archie, также оказывающие услугу поиска файлов на FTP-серверах, однако пользоваться Web-серверами гораздо удобнее.

 

Рассмотрим поисковые инструменты для поиска адресной информации. Введем понятие Белого(White) и Желтого (Yellow) поиска.

 

White-поиск – поиск адресной информации по заранее известному собственному имени адресата (имя человека или организации)

 

Yellow-поиск – поиск собственного имени по дополнительным признакам (по роду деятельности, по географическому признаку), а затем поиск его адресной информации.

 

Обычно Yellow Pages системы фактически сразу включают в себя и White Pages – у найденного адресата сразу видны его телефон и почтовый адрес. Кроме того, некоторые Yellow Pages позволяют искать просто в алфавитном списке своих абонентов (white-поиск). С другой стороны, White pages также содержат элементы yellow-поиска – кроме задания собственного имени они обычно позволяют указать название города, штата и другие, сужающие поиск, данные (что необходимо в случае многих однофамильцев). Возможно, именно поэтому многие on-line телефонные справочники, выполняющие, фактически white-поиск, называют себя Yellow pages.

 

Здесь приведены адреса Web-систем для поиска адресной информации для людей и организаций.

 

Поиск людей:

 

Поиск людей на Yahoo (http://people.yahoo.com).

 

Система WhoWhere (www.whowhere.com).

 

Система Bigfoot (www.bigfoot.com).

 

Поиск организаций:

 

раздел Желтые страницы (Yellow pages) на поисковых системах

 

специализированные сервера

 

www.yellowpages.com – для поиска в США и других странах

40. Создание Web-документов. Применение языка HTML: структура документа HTML, элементы HTML.

Размещение собственных материалов в Интернете включает два этапа: подготовку материалов и их публикацию. Подготовка материалов состоит в создании документов, имеющих формат, принятый в Интернете, то есть, Web-страниц, написанных на языке HTML. Публикация материалов, то есть открытие к ним доступа, осуществляется после решения организационных вопросов, связанных с получением дискового пространства на Web-сервере для их размещения.

 

Создание Web-документов

 

Автономные Web-документы используют язык HTML (Hypertext Markup Language — язык разметки гипертекста). Гипертекст, то есть расширенный текст, включает дополнительные элементы: иллюстрации, ссылки, вставные объекты. Пол разметкой понимается использование специальных кодов, легко отделяемых от смыслового содержания документа и используемых для реализации гипертекста. Применение этих кодов подчиняется строгим правилам, определяемым спецификацией языка HTML.

 

Особенность описания документа средствами языка HTML связана с принципиальной невозможностью достижения абсолютной точности воспроизведения исходного документа. Предполагается, что документ будет широко доступен в Интернете, и поэтому неизвестно, как будет организовано его воспроизведение. Документ может быть представлен на графическом экране, выведен в чисто текстовом виде или просто «прочитан» программой синтеза речи. Разметка HTML во всех этих случаях должна быть принята во внимание. Поэтому язык HTML предназначен не для форматирования документа, а для его функциональной разметки. Например, документы обычно начинаются с заголовков. Свойство части документа «быть заголовком» — это не особенность форматирования документа, а характеристика его содержания. Конкретное средство отображения документа (броузер) выбирает свой способ представления части документа, описанной как заголовок.

 

Управляющие конструкции языка HTML называются тегами и вставляются непосредственно в текст документа. Все теги заключаются в угловые скобки <...>.

 

Сразу после открывающей скобки помещается ключевое слово, определяющее тег, например <DIV>. Теги HTML бывают парными и непарными. Непарные теги оказывают воздействие на весь документ или определяют разовый эффект в месте своего появления. При использовании парных тегов в документ добавляются открывающий и закрывающий теги, которые воздействуют на часть документа, заключенную между ними. Закрывающий тег отличается от открывающего наличием символа «/» (косая черта) перед ключевым словом (</DIV>). Закрытие парных тегов выполняется так, чтобы соблюдались правила вложения.

 

Эффект применения тега может видоизменяться путем добавления атрибутов. В парных тегах атрибуты добавляются только к открывающему тегу. Атрибуты представляют собой дополнительные ключевые слова, отделяемые от ключевого слова, определяющего тег, и от других атрибутов пробелами и размещаемые до завершающего тег символа «>». Способ применения некоторых атрибутов требует указания значения атрибута. Значение атрибута отделяется от ключевого слова атрибута символом «=» (знак равенства) и заключается в кавычки.

 

<Н1 ALIGN="LEFT">

 

Определение HTML как языка разметки основывается на том, что при удалении из документа всех тегов получается текстовый документ, совершенно эквивалентный по содержанию исходному гипертекстовому документу. Таким образом, при отображении документа HTML сами теги не отображаются, но влияют на способ отображения остальной части документа.

 

Если говорить о создании документов HTML, то можно представить себе два способа их формирования. Первый состоит в разметке существующего (или создаваемого) документа вручную. При этом автор или редактор добавляет в документ теги разметки. Эту работу можно выполнять в текстовом редакторе или редакторе HTML, имеющем специальные элементы управления для упрощения ввода тегов. В обоих этих случаях работа ведется средствами языка HTML, и человек, выполняющий эту работу, должен знать и уметь применять этот язык.

 

Принципы другого подхода можно понять на основе изучения работы текстовых процессоров. Информацию о форматировании документа также можно рассматривать как «разметку», добавляемую в форматируемый документ. Однако для использования текстового процессора не требуется никаких знаний о формате документа и «языке разметки»: изменения, отображаемые на экране, вносятся в документ автоматически. Такой принцип соответствия экранного изображения реальному получил название WYSIWYG (от английского What You See Is What You Get — Что видите, то и получаете). Простейший редактор WYSIWYG для языка HTML, Frontpage Express, входит в состав операционной системы Windows 98.

 

Первый способ позволяет создавать более универсальные, более качественные и более разнообразные документы. Второй способ проще освоить, так как он не требует знания языка HTML. Однако в этом случае используются средства форматирования вместо средств описания, что может иногда приводить к нежелательным последствиям.

 

Процесс создания Web-документов сродни программированию и так же подвержен ошибкам. Независимо от того, каким способом создается документ, следует регулярно проверять его соответствие замыслу, просматривая его в различных броузерах. Для художественной оценки получающейся страницы следует обратиться к независимому мнению.

 

Применение языка HTML

 

Структура документа HTML

 

Все документы HTML имеют одну и ту же структуру, определяемую фиксированным набором тегов структуры. Документ HTML всегда должен начинаться с тега <HTML> и заканчиваться соответствующим закрывающим тегом (</HTML>). Внутри документа выделяются два основных раздела: раздел заголовков и тело документа, — идущие именно в таком порядке. Раздел заголовков содержит информацию, описывающую документ в целом, и ограничивается тегами <HEAD> и </HEAD>. В частности, раздел заголовков должен содержать общий заголовок документа, ограниченный парным тегом <TITLE>.

 

Основное содержание размещается в теле документа, которое ограничивается парным тегом <BODY>. Строго говоря, положение структурных тегов в документе нетрудно определить, даже если они опущены. Поэтому стандарт языка HTML требует только наличия тега <TITLE> (и, соответственно, </TITLE>). Тем не менее, при создании документа HTML опускать структурные теги не рекомендуется.

 

Простейший правильный документ HTML, содержащий все теги, определяющие структуру, может выглядеть следующим образом:

 

Любой Web-документ, должен иметь минимальный набор управляющих элементов - тэгов - только тогда он может правильно отображаться в окне программы-браузера.

 

Тэги можно набирать как заглавными, так и строчными символами. Аккуратно набирайте содержимое тэгов, т.к. никаких сообщений об ошибках браузеры не выводят! Почти каждому тэгу соответствует парный закрывающий тэг.

 

· Вот пример простейшего Web-документа, который отображает строку в заголовке окна браузера и строку в его окне:

<html>

открывающий тэг Web-документа

 

<head>

открывающий тэг заголовка документа

 

<title>

открывающий тег заголовка окна браузера

 

Моя первая страница

содержимое заголовка окна браузера

 

</title>

закрывающий тэг заголовка окна браузера

 

</head>

закрывающий тэг заголовка документа

 

<body>

открывающий тэг тела документа

 

Это моя первая страница Web

содержимое документа, отображаемое в окне браузера

 

</body>

закрывающий тэг тела документа

 

</html>

закрывающий тэг Web-документа



<== предыдущая лекция | следующая лекция ==>
Гипертекстовые и мультимедийные информационные технологии | Функциональные блочные элементы


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.17 сек.