第 1 章 · 产品概述
Agentic Data Analytics Platform (ADAP) AI 驱动的全链路数据分析平台
1.1 产品定位与核心理念
ADAP(Agentic Data Analytics Platform)是一个 AI 驱动的全链路数据分析平台。用户只需提供数据源连接信息,平台的 AI Agent 团队便能自动完成数据建模、接入、治理、分析与可视化,最终输出可直接使用的业务仪表盘和洞察报告。
核心理念
「不是给用户更多工具,而是给用户一个懂数据的 AI 团队。」
传统数据分析平台的设计前提是:用户知道要分析什么。这个假设对于数据工程师或资深分析师成立,但对于大多数业务用户和中小企业而言,恰恰是最大的障碍——他们拥有数据,却不知道从哪里开始分析。
ADAP 的差异化在于通过「数据产品经理 Agent」主动探索数据、识别行业背景、推荐分析方向,从根本上解决"客户不知道该分析什么"的问题。这是从 工具(Tool)→ 助手(Copilot)→ 自主 Agent 的能力跃迁。
1.2 解决的核心痛点
AWS 数据分析生态拥有强大的服务矩阵(S3、Glue、Athena、Redshift、QuickSight、Lake Formation 等),但用户在实际使用中面临以下四大核心痛点:
| # | 痛点 | 具体表现 |
|---|---|---|
| 1 | 学习曲线陡峭 | 每个服务都有独立的配置逻辑、API 和最佳实践;从数据源到洞察需要串联 5~8 个服务,需要专业的数据工程团队支撑 |
| 2 | 重复性操作繁多 | 创建 Glue Crawler、编写 ETL 脚本、配置 Lake Formation 权限……80% 是可模板化的重复操作,却消耗大量人力 |
| 3 | 缺乏分析方向指引 | 客户(尤其是数据分析经验不足的中小企业)拿到数据后不知道该分析什么、怎么建模、应该关注哪些指标 |
| 4 | 跨服务编排复杂 | 数据从接入到可视化涉及多个阶段,手动编排容易出错、流程难以复现,出现问题难以追溯 |
ADAP 通过多层次 AI Agent 协作,系统性地解决上述四个痛点:
- 自动化完成所有重复性的服务配置与编排操作
- 由「数据产品经理 Agent」主动分析数据特征并推荐分析方向
- 提供完整的执行过程可视化和实时监控
- 支持一键将验证通过的分析流程固化为生产调度任务
1.3 与主流竞品的差异化
数据分析平台正在经历从「工具提供者」向「AI 助手」的转型。以下是 ADAP 与主流竞品的对比:
| 竞品 | Agent 能力 | 局限性 |
|---|---|---|
| Databricks Lakehouse | SQL Agent、Copilot | 仍需用户写 SQL,无法端到端自动化 |
| Snowflake Cortex | SQL Agent | 仅支持 BI 查询,无调度与数仓建模 |
| Microsoft Fabric Copilot | Copilot for Fabric | 限于 Office 生态,无独立数仓编排 |
| AWS QuickSight Q | NLP 转换为 SQL | 仅限 BI 层,无法覆盖完整数仓链路 |
| ADAP | 完整多层级 Agent 架构 | — |
💡 核心差异:上述竞品的 Agent 能力均停留在「辅助用户完成已知任务」的层面——它们假设用户知道要分析什么。ADAP 的「数据产品经理 Agent」能主动分析数据特征、识别行业背景、推荐分析方向,解决的是更上游的问题:帮用户发现值得分析的方向。
与 SageMaker Unified Studio 的关系
SageMaker Unified Studio 是 AWS 统一的数据开发 IDE,整合了 Glue、Athena、Redshift、EMR 等服务的操作入口。
| 对比维度 | SageMaker Unified Studio | ADAP |
|---|---|---|
| 定位 | 数据开发 IDE | AI 驱动的数据分析自动化平台 |
| 用户假设 | 用户会写 SQL / Python | 用户无需技术背景 |
| 核心价值 | 工具整合与统一入口 | 从需求到洞察的端到端自动化 |
| Agent 化程度 | 无 / 弱 | 完整的多层级 Agent 架构 |
推荐策略:Build-on-Top。ADAP 构建在 SageMaker Unified Studio 之上,复用其 Glue Data Catalog 和 Lake Formation 能力,专注于上层的 AI 自动化和智能分析。Agent 替代的是人在 Studio 里的手动操作,而非 Studio 本身。
1.4 核心价值主张
对业务用户
- 零门槛上手:无需了解 Glue、Athena、Lake Formation 等技术细节,只需提供数据库连接信息
- 主动发现洞察:AI 主动分析数据特征、推荐行业适配的分析方向,而非等待用户下达指令
- 所见即所得:从连接数据源到获得 QuickSight 仪表盘,全程可视化进度跟踪
对数据团队
- 自动化重复劳动:ETL 脚本、Glue Job、Athena 建表、QuickSight 数据集配置全部自动生成
- 一键转生产:验证通过的分析流程可一键转换为 MWAA Airflow DAG,实现生产级自动调度
- 数据治理内置:PII 自动检测、Lake Formation 列级权限配置、合规报告一体化
对企业
- 降低数据分析门槛:无需组建专业数据工程团队即可获得数据仓库和 BI 能力
- 加速洞察获取:从数据接入到仪表盘输出的全链路时间从天/周缩短至分钟级
- 成本可控:内置成本追踪,实时监控 AWS 服务费用与 LLM Token 消耗
1.5 产品演进路线
| 阶段 | 版本 | 核心能力 |
|---|---|---|
| MVP | v1.0 | 4 Agent 链路(DPM → Chief Architect → Data Integration → Query Builder → Visualization)+ 基础前端 |
| v2.0 | 智能分析顾问 | 新增 Analytics Advisor Agent(数据画像)+ Data Governance Agent(PII 治理) |
| v2.1 | 生产化 | Production Pipeline Agent(MWAA Airflow DAG)+ 系统设置 + 项目管理完善 |
| 规划中 | v3.0 | QA 评审 Agent + FinOps 成本优化 Agent + 持续学习 Agent |
本章参考来源:飞书设计文档 v2.0(一、二章)、项目 README、GitHub Issues #9~#144