Data Analysis
Workflow для анализа данных от постановки задачи до выводов и визуализации. Следует методологии CRISP-DM с циклами валидации качества данных и полноты анализа.
mcp__moira__start({ workflowId: "data-analysis" })Процесс
Заголовок раздела «Процесс»flowchart LR
A[Контекст] --> B[Проблема]
B --> C[Сбор данных]
C --> D[Подготовка]
D --> E[EDA]
E --> F[Инсайты]
F --> G[Визуализация]
G --> H[Выводы]| Шаг | Действие | Результат |
|---|---|---|
| 1. Контекст | Сбор бизнес-вопроса, контекста, источников данных, ограничений, аудитории | Документ контекста |
| 2. Проблема | Формулировка research question, гипотезы, success criteria, scope | Постановка задачи |
| 3. Сбор данных | Загрузка, изучение структуры, первичная проверка качества | Сырой dataset |
| 4. Подготовка | Обработка missing values, типов, дубликатов, outliers, transformations | Чистый dataset |
| 5. EDA | Распределения, корреляции, паттерны, preliminary insights | Отчёт EDA |
| 6. Инсайты | Проверка гипотез, ответ на research question, recommendations | Ключевые инсайты |
| 7. Визуализация | Создание графиков для key findings | Визуализации |
| 8. Выводы | Executive summary, findings, recommendations, limitations | Финальный отчёт |
Особенности
Заголовок раздела «Особенности»Циклы валидации
Заголовок раздела «Циклы валидации»| Цикл | Назначение | Критерии |
|---|---|---|
| Качество данных | Проверка готовности данных для EDA | Нет критических проблем качества |
| Полнота EDA | Проверка тщательности исследования | Все гипотезы проверены |
Точки согласования
Заголовок раздела «Точки согласования»| Точка | Решение |
|---|---|
| Постановка задачи | Подтверждение research question и scope |
| Выводы | Одобрение финальных findings и recommendations |
Стандарты качества
Заголовок раздела «Стандарты качества»| Стандарт | Описание |
|---|---|
| Воспроизводимость | Анализ можно повторить с теми же результатами |
| Валидность | Методы подходят для данных и вопроса |
| Релевантность | Findings отвечают на бизнес-вопрос |
| Ясность | Результаты понятны аудитории |
| Actionability | Рекомендации практичны |
Чеклист подготовки данных
Заголовок раздела «Чеклист подготовки данных»| Задача | Действие |
|---|---|
| Missing values | Определить, понять, обработать appropriately |
| Типы данных | Проверить и исправить типы колонок |
| Дубликаты | Обнаружить и удалить при необходимости |
| Outliers | Определить, исследовать, обработать |
| Transformations | Применить нужные transformations |
Пример конфигурации ноды
Заголовок раздела «Пример конфигурации ноды»{ "id": "explore-data", "type": "agent-directive", "directive": "Проведи exploratory data analysis. Изучи распределения, корреляции и паттерны. Документируй preliminary insights.", "completionCondition": "EDA завершён с проанализированными распределениями, корреляциями и документированными preliminary insights", "connections": { "next": "validate-eda" }}Связанное
Заголовок раздела «Связанное»- Research Workflow — Для качественных исследований с источниками
- PRD Creation — Для data-driven продуктовых решений
- Обзор шаблонов — Все доступные шаблоны