第 2 章 · 用户与使用场景

2.1 目标用户画像

ADAP 面向三类核心用户，覆盖从业务决策者到数据工程团队的完整谱系。

用户画像 A：业务决策者 / 数据分析师

属性	描述
典型职位	运营总监、业务分析师、产品经理、部门负责人
技术背景	熟悉 Excel / BI 工具，不会写 SQL，不了解 Glue/Athena 等技术
核心诉求	快速获得业务洞察；不想依赖数据团队排期；看得懂结果
痛点	有数据、有问题，但不知道如何分析；向数据团队提需求等待周期长
期望	"我只需要告诉系统我的数据库在哪，AI 帮我分析出有价值的结论"

用户画像 B：数据工程师 / 数据平台团队

属性	描述
典型职位	数据工程师、数据平台工程师、云架构师
技术背景	熟悉 AWS 数据栈（S3、Glue、Athena、EMR），会写 SQL 和 Python
核心诉求	降低重复性建设工作；快速搭建数据链路并交付给业务团队
痛点	大量时间消耗在机械重复的 ETL 配置、建表、权限设置上
期望	"让 AI 自动生成 ETL 脚本和建表语句，我只需要 Review 和部署"

用户画像 C：中小企业技术负责人 / 初创公司 CTO

属性	描述
典型职位	CTO、技术总监、独立开发者
技术背景	懂技术但没有专职数据团队
核心诉求	用最小成本构建数据分析能力；快速验证数据价值
痛点	没有数据工程师，AWS 数据栈学习成本高，无法自建数仓
期望	"一个能替代数据团队的自动化平台，成本可控"

2.2 典型使用场景

场景一：电商企业数据分析（核心 Demo 场景）

背景：某电商企业运营团队有一个 MySQL 数据库，包含订单、用户、商品、营销等 12 张业务表，共约 150 万行数据。运营总监想了解销售趋势和用户行为，但公司没有数据分析师。

使用流程：

① 运营总监登录 ADAP，在首页选择「新建数据源」
② 填写 MySQL 连接信息（JDBC URL + SSM Key），保存为「电商主库」
③ 在首页选择「电商主库」，输入业务描述（可选）：「分析用户购买行为和销售趋势」
④ 点击「开始分析」→ AI 开始自主工作

⬇ AI 自动执行（Analytics Advisor → Data Product Manager）

⑤ 跳转「分析方向确认页」：
   - 数据画像卡片：识别为「电商行业」，12张表，150万行，时间跨度 2 年
   - AI 推荐 5 个分析方向（可勾选）：
     · 销售漏斗分析（GMV 趋势）
     · 用户 RFM 分层
     · 品类表现对比
     · 营销活动 ROI
     · 用户留存率分析
   - 每个方向显示：预计耗时、预计成本、核心 KPI

⑥ 运营总监勾选前 3 个方向，点击「确认，开始执行」

⬇ AI 后台执行（Data Integration → Analytics Advisor → Data Governance → Query Builder → Visualization）

⑦ 跳转「执行监控页」：
   - Agent DAG 可视化，实时显示各 Agent 执行状态
   - 每个 Agent 运行时显示计时器和工作日志
   - 全程约 8~15 分钟

⑧ 执行完成，进入「分析结果页」：
   - 数据资产：ODS/DWD/DWS/ADS 四层表清单
   - 数据画像：字段统计、关联关系
   - 合规报告：PII 字段标注（用户手机号、邮箱等）
   - Athena SQL 历史：所有建表和 ETL 语句
   - QuickSight 仪表盘：点击直达，3 个图表仪表盘已就绪

⑨（可选）点击「转生产」：配置 MWAA 调度，固化为每日自动更新的数据管道

结果：运营总监在 15 分钟内，从零获得了一个包含 GMV 趋势图、用户分层分布、品类销售对比的 QuickSight 仪表盘，无需任何技术背景。

场景二：复用已有数据源，快速验证新分析方向

背景：数据团队已接入了「电商主库」并完成过一次分析。产品经理想针对同一数据源，单独分析「用户留存率」。

使用流程：

首页直接从下拉框选择「电商主库」（无需重新填写连接信息）
输入分析需求：「分析用户月留存率和复购周期」
系统检测到 ODS 层数据已存在，自动跳过重复 ETL，直接从数据建模阶段开始
约 3~5 分钟完成新的留存率仪表盘

幂等复用机制（Issue #65）：系统自动识别已存在的 Glue Database 和 ODS 表，跳过重复数据接入，节省时间和成本。

场景三：草稿模式 — 先保存，稍后执行

背景：数据工程师配置好了一个新数据源，但希望先保存，等业务确认分析方向后再启动。

使用流程：

填写数据源 + 分析描述后，点击「保存草稿」（而非「开始分析」）
项目以 draft 状态保存到历史列表
业务确认后，在历史页找到草稿项目，点击「开始执行」
流程正常继续

草稿状态流转：draft → initializing → exploring → ready（等待确认）→ running → completed

场景四：转生产 — 一键固化为自动调度管道

背景：分析项目验证成功，需要将每日数据自动更新并刷新仪表盘。

使用流程：

项目完成后，监控页/结果页出现「转生产」按钮
弹出配置对话框，填写：
- EMR Serverless Application ID
- MWAA DAG S3 路径
- 调度频率（默认每日）
Production Pipeline Agent 自动：
- 生成包含完整 ETL 逻辑的 Airflow DAG Python 文件
- 创建 Glue ETL Job（ODS 增量同步，自动识别时间字段作为 Bookmark Key）
- 将 DAG 文件上传到 MWAA S3 桶
MWAA 开始按计划调度，数据每日自动更新

场景五：查看历史项目 & 项目管理

背景：团队已积累多个分析项目，需要管理和查看历史结果。

操作路径：

历史页：查看所有项目，带状态标记（草稿/进行中/已完成/失败）、创建时间、成本
下线项目：项目不再使用时，删除对应 MWAA DAG，停止调度（保留数据）
删除项目：
- 模式 A：仅删除元数据（保留 AWS 资源，快速）
- 模式 B：级联删除（同时删除 Glue Tables、S3 数据、DynamoDB 记录）

2.3 用户旅程地图

完整的用户旅程分为五个阶段，对应五个核心页面：

【登录页】
    ↓ 认证（Cognito）
【首页 / HomePage】
    · 选择/新建数据源
    · 输入分析需求（或从推荐 prompt 选择）
    · 保存草稿 or 直接执行
    ↓ 提交后跳转
【分析方向确认页 / DirectionPage】
    · 查看数据画像（行业识别 / 表数 / 行数 / 时间范围）
    · 查看 AI 推荐的分析方向（可勾选）
    · 查看数据治理徽章（PII 字段概览）
    · 确认执行 or 取消
    ↓ 确认后跳转
【执行监控页 / MonitorPage】
    · Agent DAG 实时可视化（ReactFlow）
    · 各 Agent 执行状态 + 计时器
    · 实时工作日志（AgentCore CloudWatch）
    · 总耗时 / 成本统计
    ↓ 完成后跳转
【分析结果页 / ResultPage】
    · 数据资产（ODS/DWD/DWS/ADS 分层）
    · 数据画像报告（字段统计 / 关联关系）
    · 合规报告（PII 检测 / Lake Formation 标签）
    · Athena SQL 历史
    · QuickSight 仪表盘入口（完成后点亮）
    · 转生产按钮
    ↓ 可选
【QuickSight 仪表盘】（跳出至 AWS 控制台）

2.4 核心操作说明

数据源连接

目前支持 MySQL（通过 JDBC 连接 + SSM Parameter Store 管理密码）
密码通过 AWS SSM Key 传递，前端不传递明文密码（安全修复，Issue #11）
支持保存多个数据源并复用

分析方向选择

AI 基于行业知识库 + 数据画像推荐分析方向
用户可以勾选任意组合（多选）
每个方向显示预计耗时和成本，帮助用户决策

执行监控

使用 WebSocket 实时推送 Agent 状态变更
Agent 计时器从 Agent 真正启动时刻计时（非页面打开时刻）
业务语言展示阶段名称（数据接入、数据建模、可视化……），不暴露技术术语

分析结果

完成后 QuickSight 仪表盘按钮自动点亮（历史项目详情页和运行完成页体验统一）
数据资产按 ODS/DWD/DWS/ADS 分层展示，含行数、字段数、最后更新时间
合规报告展示 PII 字段检测结果和 Lake Formation 权限配置状态

本章参考来源：GitHub Issues #10 #11 #20 #21 #22 #28 #32 #42 #43 #64 #65 #74 #78 #115 #116 #118 #129 #136、前端源码 HomePage.tsx / DirectionPage.tsx / MonitorPage.tsx / ResultPage.tsx

第 2 章 · 用户与使用场景 ​

2.1 目标用户画像 ​

用户画像 A：业务决策者 / 数据分析师 ​

用户画像 B：数据工程师 / 数据平台团队 ​

用户画像 C：中小企业技术负责人 / 初创公司 CTO ​

2.2 典型使用场景 ​

场景一：电商企业数据分析（核心 Demo 场景） ​

场景二：复用已有数据源，快速验证新分析方向 ​

场景三：草稿模式 — 先保存，稍后执行 ​

场景四：转生产 — 一键固化为自动调度管道 ​

场景五：查看历史项目 & 项目管理 ​

2.3 用户旅程地图 ​

2.4 核心操作说明 ​

数据源连接 ​

分析方向选择 ​

执行监控 ​

分析结果 ​

第 2 章 · 用户与使用场景

2.1 目标用户画像

用户画像 A：业务决策者 / 数据分析师

用户画像 B：数据工程师 / 数据平台团队

用户画像 C：中小企业技术负责人 / 初创公司 CTO

2.2 典型使用场景

场景一：电商企业数据分析（核心 Demo 场景）

场景二：复用已有数据源，快速验证新分析方向

场景三：草稿模式 — 先保存，稍后执行

场景四：转生产 — 一键固化为自动调度管道

场景五：查看历史项目 & 项目管理

2.3 用户旅程地图

2.4 核心操作说明

数据源连接

分析方向选择

执行监控

分析结果