第 2 章 · 用户与使用场景
2.1 目标用户画像
ADAP 面向三类核心用户,覆盖从业务决策者到数据工程团队的完整谱系。
用户画像 A:业务决策者 / 数据分析师
| 属性 | 描述 |
|---|---|
| 典型职位 | 运营总监、业务分析师、产品经理、部门负责人 |
| 技术背景 | 熟悉 Excel / BI 工具,不会写 SQL,不了解 Glue/Athena 等技术 |
| 核心诉求 | 快速获得业务洞察;不想依赖数据团队排期;看得懂结果 |
| 痛点 | 有数据、有问题,但不知道如何分析;向数据团队提需求等待周期长 |
| 期望 | "我只需要告诉系统我的数据库在哪,AI 帮我分析出有价值的结论" |
用户画像 B:数据工程师 / 数据平台团队
| 属性 | 描述 |
|---|---|
| 典型职位 | 数据工程师、数据平台工程师、云架构师 |
| 技术背景 | 熟悉 AWS 数据栈(S3、Glue、Athena、EMR),会写 SQL 和 Python |
| 核心诉求 | 降低重复性建设工作;快速搭建数据链路并交付给业务团队 |
| 痛点 | 大量时间消耗在机械重复的 ETL 配置、建表、权限设置上 |
| 期望 | "让 AI 自动生成 ETL 脚本和建表语句,我只需要 Review 和部署" |
用户画像 C:中小企业技术负责人 / 初创公司 CTO
| 属性 | 描述 |
|---|---|
| 典型职位 | CTO、技术总监、独立开发者 |
| 技术背景 | 懂技术但没有专职数据团队 |
| 核心诉求 | 用最小成本构建数据分析能力;快速验证数据价值 |
| 痛点 | 没有数据工程师,AWS 数据栈学习成本高,无法自建数仓 |
| 期望 | "一个能替代数据团队的自动化平台,成本可控" |
2.2 典型使用场景
场景一:电商企业数据分析(核心 Demo 场景)
背景:某电商企业运营团队有一个 MySQL 数据库,包含订单、用户、商品、营销等 12 张业务表,共约 150 万行数据。运营总监想了解销售趋势和用户行为,但公司没有数据分析师。
使用流程:
① 运营总监登录 ADAP,在首页选择「新建数据源」
② 填写 MySQL 连接信息(JDBC URL + SSM Key),保存为「电商主库」
③ 在首页选择「电商主库」,输入业务描述(可选):「分析用户购买行为和销售趋势」
④ 点击「开始分析」→ AI 开始自主工作
⬇ AI 自动执行(Analytics Advisor → Data Product Manager)
⑤ 跳转「分析方向确认页」:
- 数据画像卡片:识别为「电商行业」,12张表,150万行,时间跨度 2 年
- AI 推荐 5 个分析方向(可勾选):
· 销售漏斗分析(GMV 趋势)
· 用户 RFM 分层
· 品类表现对比
· 营销活动 ROI
· 用户留存率分析
- 每个方向显示:预计耗时、预计成本、核心 KPI
⑥ 运营总监勾选前 3 个方向,点击「确认,开始执行」
⬇ AI 后台执行(Data Integration → Analytics Advisor → Data Governance → Query Builder → Visualization)
⑦ 跳转「执行监控页」:
- Agent DAG 可视化,实时显示各 Agent 执行状态
- 每个 Agent 运行时显示计时器和工作日志
- 全程约 8~15 分钟
⑧ 执行完成,进入「分析结果页」:
- 数据资产:ODS/DWD/DWS/ADS 四层表清单
- 数据画像:字段统计、关联关系
- 合规报告:PII 字段标注(用户手机号、邮箱等)
- Athena SQL 历史:所有建表和 ETL 语句
- QuickSight 仪表盘:点击直达,3 个图表仪表盘已就绪
⑨(可选)点击「转生产」:配置 MWAA 调度,固化为每日自动更新的数据管道结果:运营总监在 15 分钟内,从零获得了一个包含 GMV 趋势图、用户分层分布、品类销售对比的 QuickSight 仪表盘,无需任何技术背景。
场景二:复用已有数据源,快速验证新分析方向
背景:数据团队已接入了「电商主库」并完成过一次分析。产品经理想针对同一数据源,单独分析「用户留存率」。
使用流程:
- 首页直接从下拉框选择「电商主库」(无需重新填写连接信息)
- 输入分析需求:「分析用户月留存率和复购周期」
- 系统检测到 ODS 层数据已存在,自动跳过重复 ETL,直接从数据建模阶段开始
- 约 3~5 分钟完成新的留存率仪表盘
幂等复用机制(Issue #65):系统自动识别已存在的 Glue Database 和 ODS 表,跳过重复数据接入,节省时间和成本。
场景三:草稿模式 — 先保存,稍后执行
背景:数据工程师配置好了一个新数据源,但希望先保存,等业务确认分析方向后再启动。
使用流程:
- 填写数据源 + 分析描述后,点击「保存草稿」(而非「开始分析」)
- 项目以
draft状态保存到历史列表 - 业务确认后,在历史页找到草稿项目,点击「开始执行」
- 流程正常继续
草稿状态流转:
draft→initializing→exploring→ready(等待确认)→running→completed
场景四:转生产 — 一键固化为自动调度管道
背景:分析项目验证成功,需要将每日数据自动更新并刷新仪表盘。
使用流程:
- 项目完成后,监控页/结果页出现「转生产」按钮
- 弹出配置对话框,填写:
- EMR Serverless Application ID
- MWAA DAG S3 路径
- 调度频率(默认每日)
- Production Pipeline Agent 自动:
- 生成包含完整 ETL 逻辑的 Airflow DAG Python 文件
- 创建 Glue ETL Job(ODS 增量同步,自动识别时间字段作为 Bookmark Key)
- 将 DAG 文件上传到 MWAA S3 桶
- MWAA 开始按计划调度,数据每日自动更新
场景五:查看历史项目 & 项目管理
背景:团队已积累多个分析项目,需要管理和查看历史结果。
操作路径:
- 历史页:查看所有项目,带状态标记(草稿/进行中/已完成/失败)、创建时间、成本
- 下线项目:项目不再使用时,删除对应 MWAA DAG,停止调度(保留数据)
- 删除项目:
- 模式 A:仅删除元数据(保留 AWS 资源,快速)
- 模式 B:级联删除(同时删除 Glue Tables、S3 数据、DynamoDB 记录)
2.3 用户旅程地图
完整的用户旅程分为五个阶段,对应五个核心页面:
【登录页】
↓ 认证(Cognito)
【首页 / HomePage】
· 选择/新建数据源
· 输入分析需求(或从推荐 prompt 选择)
· 保存草稿 or 直接执行
↓ 提交后跳转
【分析方向确认页 / DirectionPage】
· 查看数据画像(行业识别 / 表数 / 行数 / 时间范围)
· 查看 AI 推荐的分析方向(可勾选)
· 查看数据治理徽章(PII 字段概览)
· 确认执行 or 取消
↓ 确认后跳转
【执行监控页 / MonitorPage】
· Agent DAG 实时可视化(ReactFlow)
· 各 Agent 执行状态 + 计时器
· 实时工作日志(AgentCore CloudWatch)
· 总耗时 / 成本统计
↓ 完成后跳转
【分析结果页 / ResultPage】
· 数据资产(ODS/DWD/DWS/ADS 分层)
· 数据画像报告(字段统计 / 关联关系)
· 合规报告(PII 检测 / Lake Formation 标签)
· Athena SQL 历史
· QuickSight 仪表盘入口(完成后点亮)
· 转生产按钮
↓ 可选
【QuickSight 仪表盘】(跳出至 AWS 控制台)2.4 核心操作说明
数据源连接
- 目前支持 MySQL(通过 JDBC 连接 + SSM Parameter Store 管理密码)
- 密码通过 AWS SSM Key 传递,前端不传递明文密码(安全修复,Issue #11)
- 支持保存多个数据源并复用
分析方向选择
- AI 基于行业知识库 + 数据画像推荐分析方向
- 用户可以勾选任意组合(多选)
- 每个方向显示预计耗时和成本,帮助用户决策
执行监控
- 使用 WebSocket 实时推送 Agent 状态变更
- Agent 计时器从 Agent 真正启动时刻计时(非页面打开时刻)
- 业务语言展示阶段名称(数据接入、数据建模、可视化……),不暴露技术术语
分析结果
- 完成后 QuickSight 仪表盘按钮自动点亮(历史项目详情页和运行完成页体验统一)
- 数据资产按 ODS/DWD/DWS/ADS 分层展示,含行数、字段数、最后更新时间
- 合规报告展示 PII 字段检测结果和 Lake Formation 权限配置状态
本章参考来源:GitHub Issues #10 #11 #20 #21 #22 #28 #32 #42 #43 #64 #65 #74 #78 #115 #116 #118 #129 #136、前端源码 HomePage.tsx / DirectionPage.tsx / MonitorPage.tsx / ResultPage.tsx