
Этапы
1. Поиск; 2.Консолидация;3.Трансформация; 4. Анализ/моделирование; 5.Интерпретация.
Этапы: Поиск информации
Информация
1.Внутренняя (80%);(различные СУБД, учетные системы, личные файлы сотрудников)
2. Внешняя.
Этапы: Консолидация
1. Декодирование; 2.Агрегирование; 3.Обогащение; 4.Очистка; 5.Объединение данных.
В основе процедуры консолидации лежит процесс ETL – Extraction, Transformation, Loading
(Извлечение, Преобразование, Загрузка).

Этапы: Консолидация. Проблемы
- «Грязные» данные
• Дубликаты;
• Пропуски;
• Аномалии и пр.
- Непродуманная стратегия ETL
Этапы: Трансформация
Представление данных наиболее удобным образом
Этапы: Анализ/Моделирование
