русс | укр

Мови програмуванняВідео уроки php mysqlПаскальСіАсемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование


Linux Unix Алгоритмічні мови Архітектура мікроконтролерів Введення в розробку розподілених інформаційних систем Дискретна математика Інформаційне обслуговування користувачів Інформація та моделювання в управлінні виробництвом Комп'ютерна графіка Лекції


Типи набору даних


Дата додавання: 2014-05-29; переглядів: 1160.


 

Дані, що складаються із записів

Дані, які найбільш часто зустрічаються – дані, що складаються із записів (record data). Приклади таких наборів даних: табличні дані, матричні дані, документальні дані, транзакційні або операційні.

Табличні дані – дані, що складаються із записів, кожний з яких складається з фіксованого набору атрибутів.

Транзакційні дані представляють особливий тип даних, де кожен запис є транзакцією, включає набір значень.

Приклад транзакційної бази даних, що містить перелік покупок клієнтів магазину, наведений на рис. 2.1.

 

Рис. 2.1. Приклад транзакційних даних

 

Графічні дані

Приклади графічних даних: WWW-дані; молекулярні структури; графи (рис. 2.2); карти.

 

Рис. 2.2. Приклад графа

 

За допомогою карт, наприклад, можна відстежити зміни об'єктів у часі та просторі, визначити характер їхнього розподілу на площині або в просторі. Перевагою графічного подання даних є більша простота їх сприйняття, чим, наприклад, табличних даних.

Приклад карти, що є картою Кохонена (моделлю нейронних мереж, які будуть розглянуті в одній з лекцій нашого курсу), представлений на рис. 2.3.

 

Рис. 2.3. Приклад даних типу "Карта Кохонена"

 

Хімічні дані

Хімічні дані являють собою особливий тип даних. Приклад таких даних: Benzene Molecule: C6H6 (рис. 2.4)

 

Рис. 2.4. Приклад хімічних даних

 

Відповідно до опитування на сайті Kdnuggets, www.kdnuggets.com (квітень, 2004 р.) "Типи аналізованих даних", найбільше число опитаних аналізує дані з "плоских" (flat table) і реляційних таблиць (26% та 24% відповідно), далі ідуть часові ряди (14%) і дані у вигляді тексту (11%).

Інші аналізовані типи даних у порядку спадання: web-контенти, XML, графіка, аудіо, відео та ін.

В даній та у наступних лекціях приводяться результати опитувань, проведених на сайті Kdnuggets, який визнаний одним з найбільш авторитетних і відомих сайтів у сфері Data Mining.

 


<== попередня лекція | наступна лекція ==>
Лекція 2. поняття даних | Формати зберігання даних


Онлайн система числення Калькулятор онлайн звичайний Науковий калькулятор онлайн