4. Экспериментальные компьютерные системы, порождающие сказки, пословицы, стихи…
Сегодня не может быть создана единая теория порождения текста.
Основная причина – неоднозначное определение понятия «текст»
Создатели системы под текстом понимают мобильную реплику, состоящую из нескольких предложений.
Создатели системы генерации метеосводок и статотчетов под текстом понимают таблицу.
Для создающихся событий это цепочка несвязанных между собой предложений, относящихся к одному объекту.
Художественный, публицистический текст:
- здесь необходимы законы построения текста разных стилей и жанров
Установлено, что процесс текстообразования состоит из 2 этапов:
Стратегического (должно быть принято решение, что писать)
Тактического (как писать)
Результатом выполнения первого этапа должно стать смысловое представление будущего текста. А результатом выполнения второго – сам текст в языковой форме.
В общем классе в системе автоматического порождения текста должны быть представлены 3 взаимосвязанных компонента:
Оболочка
Планировщик
Лингвистический редактор
Оболочка определяет назначение порождающей системы (компьютерная обучающая система или система моделирующая процесс создания сказки…) В оболочке также содержится вся база знаний, которая состоит из двух частей:
Нелингвистической (предметной), в которую входят понятия, связи и отношения между понятиями конкретной предметной области, к которой относятся порождаемый текст, т.е. которая включает формализованные сведения о конкретном языке, на которых генерируется текст (списки морфем, словарь с лексикой, синтаксические структуры предложения, семантико-синтаксические структуры абзацев и всего текста).
Основные функции планировщика:
Определяет ту инфу, которая должна быть представлена в тексте
Определяет, как инфа должна быть представлена
Осуществляет построение синтаксической структуры предложений
Определяет порядок следования абзацев в тексте
Осуществляет выбор соответствующей лексики
Все эти задачи планировщик решает с порой на оболочку.
Лингвистический реализатор обеспечивает грамматическую правильность порождаемого текста и принимает окончательные синтаксические и морфологические решения.