系统架构

mem0 Memory Service 是所有 OpenClaw Agent 的中央记忆层。它通过流水线（快照 → 摘要 → 归档）接收会话数据，利用 AWS Bedrock 将其提炼为语义记忆，并在 Agent 启动时按需注入相关上下文。

部署架构

端口映射：0.0.0.0:8230 → 容器:8230，宿主机上的 cli.py 通过 localhost:8230 连接。
挂载卷：
${OPENCLAW_BASE}:/openclaw — pipeline 读取宿主机日记文件（读写）
./data:/app/data — pipeline 写入 offset 文件和日志
${AWS_CONFIG_DIR}:/root/.aws — AWS 凭证（只读，EC2 IAM Role 时可不挂载）
AWS 凭证：EC2 上两个容器均通过 IMDS 自动使用实例 IAM Role，无需配置。非 EC2 环境在 .env 中设置 AWS_ACCESS_KEY_ID / AWS_SECRET_ACCESS_KEY。

组件职责

组件	职责
openclaw-plugin（`agent_end` hook）	每轮 agent 对话结束后触发。将对话内容实时写入 agent 的日记文件（`~/.openclaw/workspace-{agentId}/memory/YYYY-MM-DD.md`）。通过 `isNoise` 过滤噪音（问候语、简短交互），通过 `cleanContent` 清理内容。按 `agentId` 路由日记条目到各 agent 的 workspace。不直接写入 mem0——mem0 的写入完全由 auto_digest 负责。
auto_digest.py --today	每 15 分钟运行一次。读取自上次运行以来日记文件中的新增字节（通过 `auto_digest_offset.json` 追踪），以按 `##` 章节边界对齐的分批（每批最大约 50KB）配合 `infer=True` 和专属的 `DIGEST_EXTRACTION_PROMPT` 写入 mem0——该 prompt 专为工程师工作日记设计，重点保留技术标识符、性能数据、工作进展、关键决策和踩坑经验。提炼阈值为 2000 字节。每批成功后立即持久化 offset，支持断点续传。
memory_sync.py	每天 UTC 01:00 运行。将各 Agent 的 `MEMORY.md`（精选知识）直接同步到 mem0 长期记忆。基于 hash 去重，文件未变化时零 LLM 调用。
auto_dream.py / AutoDream	每天 UTC 02:00 运行。步骤一：读取昨日完整日记 → `mem0.add(infer=True, 无 run_id)` → 长期记忆。步骤二：对每条 7 天前的短期记忆，调用 `mem0.add(infer=True, 无 run_id)`——mem0 LLM 与已有长期记忆比对，返回四种决策之一：`ADD`（新知识，写入）、`UPDATE`（与已有条目合并）、`DELETE`（冗余，跳过写入）、`NONE`（已完全覆盖，跳过写入）。无论何种决策，原始短期条目处理后始终删除。
mem0 Memory Service	核心服务。使用 AWS Bedrock LLM 进行记忆提炼与去重，使用 Bedrock Embedding 进行向量化。
向量存储	持久化记忆向量，支持 S3 Vectors、OpenSearch 或 pgvector 作为后端。分数归一化在服务层处理——参见下方分数归一化层。
SKILL.md → 检索	Agent 新 session 启动时，读取 SKILL.md，查询 mem0 获取相关记忆，并将其注入为上下文。

分数归一化层

不同向量引擎返回的分数语义不一致——OpenSearch 返回相似度（越大越好），而 pgvector 和 S3 Vectors 返回余弦距离（越小越好）。

服务在 server.py 中通过 _normalize_scores() 函数进行归一化处理，在执行 min_score 过滤、时间衰减加权或返回结果之前，将所有分数统一转换为 [0, 1] 的相似度区间。这一抽象确保上层逻辑（排序、过滤、审计日志）与具体向量引擎无关。 | SKILL.md → 检索 | Agent 新会话启动时，读取 SKILL.md，查询 mem0 获取相关记忆，注入为上下文。 |

流水线时序（UTC）

实时          openclaw-plugin     — agent_end hook → 日记文件（不写 mem0）
每 15 分钟   auto_digest --today — 日记新增内容 → mem0 短期记忆（infer=True，fact extraction）
01:00        memory_sync         — MEMORY.md → mem0 长期记忆（精选知识，即时生效）
02:00        auto_dream          — 步骤一：昨日日记 → 长期记忆（infer=True）
                                   步骤二：7天前短期记忆 → 重新写入（infer=True）+ 删除

记忆分层：长期 vs 短期由谁决定？

mem0 本身没有长短期概念——默认永久保存所有写入的内容。长短期的区分完全由写入时是否携带 run_id 来决定。

	短期记忆	长期记忆
`run_id`	`YYYY-MM-DD`（日期字符串）	不传
写入者	`auto_digest.py --today`（自动）	Agent 主动写入、`memory_sync.py` 或 `auto_dream.py` / AutoDream（infer=True 整合）
生命周期	7天后由 auto_dream 整合	永久保存
典型内容	当天讨论、任务进展、临时决策	技术决策、经验教训、用户偏好

进入长期记忆的三条路径

路径一 — memory_sync.py（每天 UTC 01:00，来自 MEMORY.md）

每个 Agent 的 MEMORY.md 是质量最高的记忆来源——Agent 在 heartbeat 时主动维护，是其所学知识的精华提炼。memory_sync.py 每天 UTC 01:00 将其同步到 mem0 长期记忆，基于 hash 去重避免重复 LLM 调用。

这是最快的路径：重要决策和经验教训当天就能进入长期记忆，无需等待 7 天归档周期。

路径二 — auto_dream.py / AutoDream（每天 UTC 02:00）

每晚执行两个步骤：

步骤一：读取昨日完整日记，以 infer=True（无 run_id）写入 mem0——直接进入长期记忆，利用全天完整上下文提取高质量知识。
步骤二：对每条 7 天前的短期记忆，调用 mem0.add(infer=True, 无 run_id)。mem0 LLM 将该条记忆与已有长期记忆比对，返回四种决策之一：
- ADD — 新知识 → 写入新的长期记忆条目
- UPDATE — 与已有条目重叠 → 合并/更新
- DELETE — 冗余或被已有知识覆盖 → 跳过写入
- NONE — 已完全覆盖 → 跳过写入
无论何种决策，原始短期条目处理后始终删除。

利用 mem0 原生智能，取代了之前手写的语义搜索逻辑，消除了每次运行数千次冗余的 Bedrock API 调用。

路径三 — Agent 主动写入（随时，按需）

Agent 在对话中遇到重要信息时，直接写入长期记忆（不传 run_id）：

bash

python3 cli.py add --user boss --agent agent1 \
  --text "决定使用 S3 Vectors 作为主要向量存储" \
  --metadata '{"category":"decision"}'

`run_id` 机制

run_id 是 mem0 原生的按运行隔离的 key，我们将其复用为按日期划分的命名空间：

run_id = "2026-03-27"   →  短期记忆（当天条目）
run_id = 不传           →  长期记忆（永久保存）

设计理念

日记到 mem0 的流水线

auto_digest.py --today（每 15 分钟，增量）

每 15 分钟运行一次，只读取自上次运行以来的新增内容。以按 ## 章节边界对齐的分批（每批最大约 50KB）加 infer=True 发给 mem0——mem0 内部做 fact extraction，提炼为简洁记忆。每批成功后立即保存 offset——即使进程中断，下次运行也能从断点继续。

这提供了实时跨 session 记忆：最近 ~15 分钟的对话可在同一 agent 的其他 session 中被检索到。

auto_dream.py 步骤一（UTC 02:00，昨日日记 → 长期记忆）

每天运行一次。读取昨日完整日记，以 infer=True（无 run_id）写入 mem0——直接进入长期记忆。利用全天完整上下文，mem0 提取质量更高、去重更彻底的知识。

这提供了高质量的夜间长期记忆，充分利用整天的完整上下文。

为什么 openclaw-plugin 写日记文件而非直接写 mem0

openclaw-plugin 的 agent_end hook 将对话内容写入日记文件，而非直接写入 mem0。这是刻意的职责分离：

Plugin → 仅写日记文件（快速，无外部 API 调用，无 LLM 成本）
auto_digest --today → 写入 mem0（限速，按章节对齐的 50KB 分批，批次间 sleep）

之前的 session_snapshot.py 每 5 分钟轮询 OpenClaw 的 session API 并写入日记文件。新的 agent_end hook 方式更优：它在每轮对话结束后实时触发，消除了 5 分钟的轮询延迟和独立轮询进程的需求。日记条目按 agentId 路由到各 agent 的 workspace（~/.openclaw/workspace-{agentId}/memory/YYYY-MM-DD.md）。

为什么 MEMORY.md 是独立路径

MEMORY.md 是 Agent 在 heartbeat 时自己维护的，是其所学知识的精华——这在质量上与日记提取的短期记忆有本质区别。

将 MEMORY.md 直接路由到长期记忆（跳过短期 → 7天归档的流程），确保明确整理过的知识在后续 session 中立即可用。

系统架构 ​

部署架构 ​

组件职责 ​

分数归一化层 ​

流水线时序（UTC） ​

记忆分层：长期 vs 短期由谁决定？ ​

进入长期记忆的三条路径 ​

run_id 机制 ​

设计理念 ​

日记到 mem0 的流水线 ​

为什么 openclaw-plugin 写日记文件而非直接写 mem0 ​

为什么 MEMORY.md 是独立路径 ​