русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

ИНДУКЦИЯ ПРАВИЛ И ДЕРЕВЬЯ РЕШЕНИЙ


Дата добавления: 2015-07-09; просмотров: 1477; Нарушение авторских прав


В то время как OLAP-технологии являются лишь инструментом аналитика, существуют методики, позволя­ющие автоматически находить в дан­ных закономерности и формулиро­вать их в виде правил. Применение алгоритмов извлечения знаний поз­воляет получать в результате прави­ла следующего вида:

ЕСЛИ дата покупки приходится на декабрь И покупатель приобрел подарочное издание книги ТО покупатель также приобрел подарочную открытку КОЭФФ. УВЕРЕННОСТИ: 80%, ПОКРЫТИЕ: 10%

Указанный коэффициент уверен­ности 80% означает, что правило вы­полняется в 80% случаев, а в 20% ситуаций его заключение при истин­ных посылках оказывается неверным. Покрытие показывает, какой процент данных из общего количества удов­летворяет этому правилу.

Индукция правил по массивам дан­ных может стать альтернативой руч­ному способу построения баз знаний (рис. 2). Однако полученные в резуль­тате правила не всегда правильно от­ражают закономерности предметной области, поэтому методы машинного обучения скорее подходят для анали­за данных в такой последовательнос­ти: обработка данных машинными ме­тодами, затем изучение полученных результатов экспертами или инжене­рами по знаниям.

Для индукции правил существуют известные алгоритмы ID3 и C4.5, реа­лизованные во многих специализи­рованных системах для анализа дан­ных и машинного обучения (Orange, iDA и другие). Эти алгоритмы основа­ны на построении деревьев решений – древовидных диаграмм, наглядно по­казывающих ход решения задачи (см. рис. 4).

Другой важной задачей, решае­мой в рамках машинного обучения, является кластеризация и классифи­кация, в ходе которых множество объ­ектов разбивается на некоторые ха­рактерные классы. В случае с интер­нет-магазином имеет смысл разбивать потребительскую аудиторию по клас­сам интересов (научная фантастика, философия и т.д.) с учетом совершен­ных ими покупок и затем предлагать каждой категории соответствующую литературу. Более сложная задача классификации – с учетом текста кни­ги относить ее к той или иной смысло­вой категории.



Задача кластеризации может ре­шаться как на основании обучения с учителем (когда мы заранее задаем множество классов и примеров объ­ектов, попадающих в эти классы), так и путем обучения без учителя, когда задается только число классов, а мно­жества похожих объектов выделяют­ся и группируются алгоритмом самос­тоятельно. Например, можно попро­сить алгоритм разбить все множество на три класса, тем самым обнаружив наиболее явные группы покупателей автоматически (это могут быть, к примеру, "техническая литера­тура и фэнтези", "любовные романы и эзотерика" и "поэзия и искусство").

Еще одна разновидность обуче­ния - группа статистических методов, известная как коллаборативная фильтрация. Вполне закономерно, что если большинство покупателей учебника по искусственному интел­лекту также приобретают какой-либо носитель с фильмом "Матрица", то новым покупателям подобных книг можно в ненавязчивой форме пред­лагать и этот товар. Простейшим при­мером коллаборативной фильтрации являются подсказки интернет-магази­нов "вместе с этим товаром также по­купают". Отличительной особен­ностью коллаборативной фильтрации является то, что генерирования зна­ний по данным не происходит, а спи­сок объектов получают с учетом ис­ходных данных чисто статистическими методами .


ХРАНИЛИЩА ДАННЫХ И КОРПОРАТИВНАЯ ПАМЯТЬ

 

Накопленные в ходе работы фир­мы данные исключительно ценны. Не­обходимо как-то изолировать накоп­ленные данные с целью минимизации риска испортить их в процессе работы: утрата такой ценности недопустима. Кроме того, превышение объема ин­формации общей базы данных неиз­бежно приводит к снижению произво­дительности.

Условно разделяют рабочую базу данных, отвечающую за текущее функционирование предприятия, и хранилище данных (data warehouse), назначение которого – накопление всего массива данных с целью даль­нейшего анализа. Как правило, от ра­бочей базы данных требуется высо­кая производительность с поддерж­кой транзакций. Хранилище данных, в свою очередь, может иметь несколь­ко другую структуру и быть доступ­ным только на чтение для аналитиков. Данные из рабочей базы данных пе­риодически заносятся в хранилище. При этом может происходить провер­ка данных на непротиворечивость, преобразование структуры данных в вид, удобный для анализа и т.д. Архи­тектура хранилища данных показана на рис. 5. Использовать хранилища данных имеет смысл даже тогда, когда планируется применять простейшие методы анализа данных типа OLAP.

Многие знания, существующие только в нематериальном виде (в го­ловах сотрудников), никак не отра­жаются в базах данных предприятия или вообще не преобразуются в электронный вид. Более широкое по­нятие, корпоративная память, отно­сится к централизованному накопле­нию всех возникающих при работе документов: формуляров, служеб­ных инструкций и т.д. Хранилище до­кументов, определенным образом организованное ручной или автома­тической категоризацией, зачастую также называют корпоративной ба­зой знаний. Хотя с точки зрения ИИ такое название является не совсем корректным (база знаний такого ро­да не может быть использована

компьютером для полу­чения логических выво дов и для решения за­дач). Корпоративная па мять играет важнейшую роль в увековечении опыта сотрудников.



<== предыдущая лекция | следующая лекция ==>
МАШИННОЕ ОБУЧЕНИЕ | МАШИННОЕ ОБУЧЕНИЕ – КЛЮЧ К КИБЕРНЕТИЧЕСКОМУ БЕССМЕРТИЮ


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 2.315 сек.