Перейти к содержимому

Data Analysis

Workflow для анализа данных от постановки задачи до выводов и визуализации. Следует методологии CRISP-DM с циклами валидации качества данных и полноты анализа.

Окно терминала
mcp__moira__start({ workflowId: "data-analysis" })
flowchart LR
    A[Контекст] --> B[Проблема]
    B --> C[Сбор данных]
    C --> D[Подготовка]
    D --> E[EDA]
    E --> F[Инсайты]
    F --> G[Визуализация]
    G --> H[Выводы]
ШагДействиеРезультат
1. КонтекстСбор бизнес-вопроса, контекста, источников данных, ограничений, аудиторииДокумент контекста
2. ПроблемаФормулировка research question, гипотезы, success criteria, scopeПостановка задачи
3. Сбор данныхЗагрузка, изучение структуры, первичная проверка качестваСырой dataset
4. ПодготовкаОбработка missing values, типов, дубликатов, outliers, transformationsЧистый dataset
5. EDAРаспределения, корреляции, паттерны, preliminary insightsОтчёт EDA
6. ИнсайтыПроверка гипотез, ответ на research question, recommendationsКлючевые инсайты
7. ВизуализацияСоздание графиков для key findingsВизуализации
8. ВыводыExecutive summary, findings, recommendations, limitationsФинальный отчёт
ЦиклНазначениеКритерии
Качество данныхПроверка готовности данных для EDAНет критических проблем качества
Полнота EDAПроверка тщательности исследованияВсе гипотезы проверены
ТочкаРешение
Постановка задачиПодтверждение research question и scope
ВыводыОдобрение финальных findings и recommendations
СтандартОписание
ВоспроизводимостьАнализ можно повторить с теми же результатами
ВалидностьМетоды подходят для данных и вопроса
РелевантностьFindings отвечают на бизнес-вопрос
ЯсностьРезультаты понятны аудитории
ActionabilityРекомендации практичны
ЗадачаДействие
Missing valuesОпределить, понять, обработать appropriately
Типы данныхПроверить и исправить типы колонок
ДубликатыОбнаружить и удалить при необходимости
OutliersОпределить, исследовать, обработать
TransformationsПрименить нужные transformations
{
"id": "explore-data",
"type": "agent-directive",
"directive": "Проведи exploratory data analysis. Изучи распределения, корреляции и паттерны. Документируй preliminary insights.",
"completionCondition": "EDA завершён с проанализированными распределениями, корреляциями и документированными preliminary insights",
"connections": {
"next": "validate-eda"
}
}