DataPilot AI — AI-ассистент для dbt-проектов
AI-ассистент для dbt-проектов

DataPilot AI —
знает
ваш dbt-проект

Специализированные AI-агенты для разработки
корпоративных хранилищ данных

dbt RAG LLM Data Engineering
Запросить демо
DataPilot AI — Chat Interface
// dbt project: dwh_retail · 847 models · lineage loaded

user › Как строится метрика revenue в витрине
mart_sales_summary?
Метрика revenue агрегируется в модели mart_sales_summary из fct_orders через JOIN с dim_products. Источник — stg_erp__orders. Логика: SUM(quantity × unit_price) за вычетом returns.
user › Создай витрину для BI: продажи по регионам
за последние 90 дней
Генерирую модель mart_sales_by_region_90d на основе fct_orders × dim_geo. Структура соответствует соглашениям проекта.
datapilot › готово

Работа с хранилищем
требует слишком
глубокой экспертизы

Это замедляет разработку, перегружает дата-команду и увеличивает time-to-market. Каждый новый запрос от бизнеса превращается в многодневный проект — даже если задача типовая.

01
Ресурсы команды заняты рутиной

Дата-инженеры и архитекторы тратят время на повторяемые задачи: шаблонный SQL, документирование, ревью типовых моделей — вместо решения сложных архитектурных задач.

02
Новые модели данных — медленно и дорого

Путь от бизнес-запроса до готовой витрины занимает дни и недели: проектирование структуры, поиск источников, профилирование, написание трансформаций, ревью.

03
Разобраться в объектах КХД — сложно и долго

Сотни моделей, сложные зависимости, legacy-код. Инженерам и аналитикам нужен инструмент, чтобы быстро ориентироваться в проекте и находить нужные данные.

04
BI-разработчики не имеют доступа к данным

BI-разработчики не могут самостоятельно определять нужные витрины для построения отчётности — каждый запрос требует участия дата-инженера.

05
Generative AI не знает ваш проект

ChatGPT, Copilot, Cursor генерируют код «вслепую» — без знания ваших моделей, lineage, стандартов именования и бизнес-логики. Результат: галлюцинации, несуществующие таблицы, несовместимость с проектом. Чем меньше контекста — тем ниже качество. Высокий контекст — высокая стоимость.

Что даёт DataPilot AI

01
Автоматизация разработки КХД

Проектирование структуры, выбор источников, профилирование, генерация SQL, ревью — end-to-end. DataPilot знает ваши модели, соглашения и lineage, поэтому генерирует код, совместимый с проектом с первого раза.

Результат
Ускорение time-to-market аналитических продуктов
Повышение зрелости Data Governance
02
dbt-проект как интерактивная база знаний

Автообнаружение моделей, lineage, документации. LLM понимает структуру и связи ваших данных — и отвечает на вопросы о проекте так, как будто рядом сидит старший инженер, знающий каждую таблицу.

Результат
Демократизация данных — расширение круга пользователей без пропорционального найма

DataPilot AI — для каждой роли в команде

Дата-инженеры

Ускорение типовых действий: генерация моделей, тестов, документации. Меньше рутины — больше архитектурных решений.

Дата-аналитики

Самостоятельная работа с моделями, прямой доступ к необходимым данным без очереди к инженерам.

BI-разработчики

Доступ к витринам и навигация по проекту без привлечения дата-инженера на каждый запрос.

Архитекторы данных

Ревью, стандартизация, контроль качества. DataPilot соблюдает ваши стандарты именования и шаблоны при любой генерации.

Разработка КХД по-новому:
разделяй и автоматизируй

Стандартный бизнес-процесс разработки КХД
1
Бизнес-описание витрины
Бизнес-аналитик
2
Навигация по источникам данных
Дата-инженер, системный аналитик
3
Профилирование данных
Дата-инженер, дата-аналитик
4
Генерация SQL-трансформаций
Дата-инженер
5
Ревью и валидация
Архитектор, Техлид
Вспомогательные процессы
Data Quality (тестирование)
Data Governance (документация, lineage, метаданные)
Разработка с DataPilot AI

Наш подход: каждому шагу — свой агент и внимание инженера

БИЗНЕС-ПРОЦЕСС AI-АГЕНТ 1. Бизнес-описание витрины Semantic Agent 2. Навигация по источникам Source Data Agent 3. Профилирование данных Profiling Agent 4. Генерация SQL Model Builder Agent 5. Компиляция / запуск / тест CLI Agent 6. Ревью и валидация Architect Review Agent Инженер Human in the loop

AI-агенты и Human-in-the-Loop

Human-in-the-Loop Pipeline
👤 Бизнес- аналитик 🤖 Model Architect Agent 👤 Дата-инженер 🤖 Datamart Builder Agent 👤 Архитектор, Техлид Формулирует бизнес-описание витрины Проектирует структуру, предлагает источники, профилирует Проверяет и уточняет источники, качество Генерирует SQL-код, компилирует, запускает тесты Финальное ревью, утверждение 📥 Вход 🤖 AI + ревью ✅ Checkpoint 🤖 AI + ревью ✅ Checkpoint
Ключевые моменты
01
Человек остаётся в контуре принятия решений. AI-агент предлагает — человек утверждает.
02
Каждый агент специализирован на своём шаге:
  • Имеет свой системный промпт (роль, контекст, ограничения)
  • Имеет пресет входных данных (что принимает) и выходных (в каком формате отдаёт)
  • Работает только со своим набором инструментов
03
Снижение галлюцинаций. Агент не может выйти за рамки своего пресета и доступных инструментов — в отличие от «всезнающего» IDE-ассистента.
04
Orchestrator маршрутизирует запросы к нужному агенту — пользователю не нужно думать, к кому обращаться.

Архитектура DataPilot AI

Developer / Analyst в VS Code VS Code Extension Chat Panel / Actions API / Gateway ORCHESTRATOR (LLM) routing / context / workflow Discovery Agent Datamart / SQL Agent RAG / Vector Search Metadata Store lineage / docs dbt Project models / YAML / SQL · docs / tests / macros dbt CLI compile / test Git Repository branches / PR DWH / Lakehouse

RAG — мост к вашему dbt-проекту

RAG-подход позволяет агентам работать с актуальным состоянием dbt-проекта, извлекая только релевантные метаданные — без необходимости передавать весь проект в контекстное окно LLM. Это снижает стоимость и повышает точность генерации.

Мост между dbt-проектом и AI-агентами

Модели, lineage, метрики, документация индексируются и доступны агентам через векторный поиск (RAG). Агент получает только релевантный контекст, а не весь проект целиком.

Промпты для каждого агента

Системные инструкции, определяющие поведение, ограничения и формат вывода каждого агента. Агент не выходит за рамки своей роли и доступного контекста.

Почему не Copilot / Cursor / ChatGPT?

DataPilot AI — это не ещё один AI-редактор кода. Это система специализированных агентов, встроенная в бизнес-процесс разработки хранилища данных.

Критерий Generic IDE (Cursor, Copilot) DataPilot AI
Знание проекта   Видит только открытые файлы   Знает весь dbt-проект: модели, lineage, метрики, структуру
Контекст   Ограничен окном контекста IDE   RAG предоставляет релевантный контекст проекта по запросу
Стоимость токенов   Весь проект «вливается» в контекст → дорого   Агент получает только релевантные метаданные через RAG
Специализация   Универсальный ассистент   Агенты заточены под шаги процесса dbt-разработки
Пресеты и ограничения   Нет контроля формата вывода   Каждый агент имеет пресет: формат входа, выхода, правила валидации
Бизнес-процесс   Не знает ваш workflow   Агенты встроены в цепочку процесса разработки КХД
Human-in-the-loop   Ad-hoc ревью   Ревью встроено в pipeline агентов

Создан командой Sapiens solutions

Ведущая компания в области аналитики и интеграции данных, предоставляющая передовые решения для бизнеса
14+
лет опыта разработки и внедрения аналитических решений
90+
успешно выполненных проектов
150+
дата-инженеров, разработчиков и специалистов по интеграции
Экспертиза
DWH: ADB, ADQM, ADH, DBT, SAP BW/HANA ETL: Airflow, NiFi, Proplum BI: Superset, SAP BO, Insight, Форсайт EPM: Форсайт, SAP BPC DG: Arenadata Catalog, Arenadata Catalog DQF AI NLP: Easy Report, Python, NLP
Пилот

Начните с пилота
за 4 недели

Технология усиливает то, что у вас уже есть. Если у вас есть dbt-проект — DataPilot AI сделает вашу команду быстрее, точнее и автономнее.

Обсудить пилот
Подключение к вашему dbt-проекту
Настройка RAG и трёх AI-агентов
Интеграция с вашей LLM (OpenAI / Anthropic / локальная модель)
Расширение для VS Code для команды
Обучение и onboarding