Skip to content

第 2 章 · 用户与使用场景


2.1 目标用户画像

ADAP 面向三类核心用户,覆盖从业务决策者到数据工程团队的完整谱系。

用户画像 A:业务决策者 / 数据分析师

属性描述
典型职位运营总监、业务分析师、产品经理、部门负责人
技术背景熟悉 Excel / BI 工具,不会写 SQL,不了解 Glue/Athena 等技术
核心诉求快速获得业务洞察;不想依赖数据团队排期;看得懂结果
痛点有数据、有问题,但不知道如何分析;向数据团队提需求等待周期长
期望"我只需要告诉系统我的数据库在哪,AI 帮我分析出有价值的结论"

用户画像 B:数据工程师 / 数据平台团队

属性描述
典型职位数据工程师、数据平台工程师、云架构师
技术背景熟悉 AWS 数据栈(S3、Glue、Athena、EMR),会写 SQL 和 Python
核心诉求降低重复性建设工作;快速搭建数据链路并交付给业务团队
痛点大量时间消耗在机械重复的 ETL 配置、建表、权限设置上
期望"让 AI 自动生成 ETL 脚本和建表语句,我只需要 Review 和部署"

用户画像 C:中小企业技术负责人 / 初创公司 CTO

属性描述
典型职位CTO、技术总监、独立开发者
技术背景懂技术但没有专职数据团队
核心诉求用最小成本构建数据分析能力;快速验证数据价值
痛点没有数据工程师,AWS 数据栈学习成本高,无法自建数仓
期望"一个能替代数据团队的自动化平台,成本可控"

2.2 典型使用场景

场景一:电商企业数据分析(核心 Demo 场景)

背景:某电商企业运营团队有一个 MySQL 数据库,包含订单、用户、商品、营销等 12 张业务表,共约 150 万行数据。运营总监想了解销售趋势和用户行为,但公司没有数据分析师。

使用流程

① 运营总监登录 ADAP,在首页选择「新建数据源」
② 填写 MySQL 连接信息(JDBC URL + SSM Key),保存为「电商主库」
③ 在首页选择「电商主库」,输入业务描述(可选):「分析用户购买行为和销售趋势」
④ 点击「开始分析」→ AI 开始自主工作

⬇ AI 自动执行(Analytics Advisor → Data Product Manager)

⑤ 跳转「分析方向确认页」:
   - 数据画像卡片:识别为「电商行业」,12张表,150万行,时间跨度 2 年
   - AI 推荐 5 个分析方向(可勾选):
     · 销售漏斗分析(GMV 趋势)
     · 用户 RFM 分层
     · 品类表现对比
     · 营销活动 ROI
     · 用户留存率分析
   - 每个方向显示:预计耗时、预计成本、核心 KPI

⑥ 运营总监勾选前 3 个方向,点击「确认,开始执行」

⬇ AI 后台执行(Data Integration → Analytics Advisor → Data Governance → Query Builder → Visualization)

⑦ 跳转「执行监控页」:
   - Agent DAG 可视化,实时显示各 Agent 执行状态
   - 每个 Agent 运行时显示计时器和工作日志
   - 全程约 8~15 分钟

⑧ 执行完成,进入「分析结果页」:
   - 数据资产:ODS/DWD/DWS/ADS 四层表清单
   - 数据画像:字段统计、关联关系
   - 合规报告:PII 字段标注(用户手机号、邮箱等)
   - Athena SQL 历史:所有建表和 ETL 语句
   - QuickSight 仪表盘:点击直达,3 个图表仪表盘已就绪

⑨(可选)点击「转生产」:配置 MWAA 调度,固化为每日自动更新的数据管道

结果:运营总监在 15 分钟内,从零获得了一个包含 GMV 趋势图、用户分层分布、品类销售对比的 QuickSight 仪表盘,无需任何技术背景。


场景二:复用已有数据源,快速验证新分析方向

背景:数据团队已接入了「电商主库」并完成过一次分析。产品经理想针对同一数据源,单独分析「用户留存率」。

使用流程

  1. 首页直接从下拉框选择「电商主库」(无需重新填写连接信息)
  2. 输入分析需求:「分析用户月留存率和复购周期」
  3. 系统检测到 ODS 层数据已存在,自动跳过重复 ETL,直接从数据建模阶段开始
  4. 约 3~5 分钟完成新的留存率仪表盘

幂等复用机制(Issue #65):系统自动识别已存在的 Glue Database 和 ODS 表,跳过重复数据接入,节省时间和成本。


场景三:草稿模式 — 先保存,稍后执行

背景:数据工程师配置好了一个新数据源,但希望先保存,等业务确认分析方向后再启动。

使用流程

  1. 填写数据源 + 分析描述后,点击「保存草稿」(而非「开始分析」)
  2. 项目以 draft 状态保存到历史列表
  3. 业务确认后,在历史页找到草稿项目,点击「开始执行」
  4. 流程正常继续

草稿状态流转:draftinitializingexploringready(等待确认)→ runningcompleted


场景四:转生产 — 一键固化为自动调度管道

背景:分析项目验证成功,需要将每日数据自动更新并刷新仪表盘。

使用流程

  1. 项目完成后,监控页/结果页出现「转生产」按钮
  2. 弹出配置对话框,填写:
    • EMR Serverless Application ID
    • MWAA DAG S3 路径
    • 调度频率(默认每日)
  3. Production Pipeline Agent 自动:
    • 生成包含完整 ETL 逻辑的 Airflow DAG Python 文件
    • 创建 Glue ETL Job(ODS 增量同步,自动识别时间字段作为 Bookmark Key)
    • 将 DAG 文件上传到 MWAA S3 桶
  4. MWAA 开始按计划调度,数据每日自动更新

场景五:查看历史项目 & 项目管理

背景:团队已积累多个分析项目,需要管理和查看历史结果。

操作路径

  • 历史页:查看所有项目,带状态标记(草稿/进行中/已完成/失败)、创建时间、成本
  • 下线项目:项目不再使用时,删除对应 MWAA DAG,停止调度(保留数据)
  • 删除项目
    • 模式 A:仅删除元数据(保留 AWS 资源,快速)
    • 模式 B:级联删除(同时删除 Glue Tables、S3 数据、DynamoDB 记录)

2.3 用户旅程地图

完整的用户旅程分为五个阶段,对应五个核心页面:

【登录页】
    ↓ 认证(Cognito)
【首页 / HomePage】
    · 选择/新建数据源
    · 输入分析需求(或从推荐 prompt 选择)
    · 保存草稿 or 直接执行
    ↓ 提交后跳转
【分析方向确认页 / DirectionPage】
    · 查看数据画像(行业识别 / 表数 / 行数 / 时间范围)
    · 查看 AI 推荐的分析方向(可勾选)
    · 查看数据治理徽章(PII 字段概览)
    · 确认执行 or 取消
    ↓ 确认后跳转
【执行监控页 / MonitorPage】
    · Agent DAG 实时可视化(ReactFlow)
    · 各 Agent 执行状态 + 计时器
    · 实时工作日志(AgentCore CloudWatch)
    · 总耗时 / 成本统计
    ↓ 完成后跳转
【分析结果页 / ResultPage】
    · 数据资产(ODS/DWD/DWS/ADS 分层)
    · 数据画像报告(字段统计 / 关联关系)
    · 合规报告(PII 检测 / Lake Formation 标签)
    · Athena SQL 历史
    · QuickSight 仪表盘入口(完成后点亮)
    · 转生产按钮
    ↓ 可选
【QuickSight 仪表盘】(跳出至 AWS 控制台)

2.4 核心操作说明

数据源连接

  • 目前支持 MySQL(通过 JDBC 连接 + SSM Parameter Store 管理密码)
  • 密码通过 AWS SSM Key 传递,前端不传递明文密码(安全修复,Issue #11)
  • 支持保存多个数据源并复用

分析方向选择

  • AI 基于行业知识库 + 数据画像推荐分析方向
  • 用户可以勾选任意组合(多选)
  • 每个方向显示预计耗时和成本,帮助用户决策

执行监控

  • 使用 WebSocket 实时推送 Agent 状态变更
  • Agent 计时器从 Agent 真正启动时刻计时(非页面打开时刻)
  • 业务语言展示阶段名称(数据接入、数据建模、可视化……),不暴露技术术语

分析结果

  • 完成后 QuickSight 仪表盘按钮自动点亮(历史项目详情页和运行完成页体验统一)
  • 数据资产按 ODS/DWD/DWS/ADS 分层展示,含行数、字段数、最后更新时间
  • 合规报告展示 PII 字段检测结果和 Lake Formation 权限配置状态

本章参考来源:GitHub Issues #10 #11 #20 #21 #22 #28 #32 #42 #43 #64 #65 #74 #78 #115 #116 #118 #129 #136、前端源码 HomePage.tsx / DirectionPage.tsx / MonitorPage.tsx / ResultPage.tsx

Released under the MIT License.