實戰手冊 · Field Manual 2026 春季號
github.com/rohitg00/agentmemory · 16.1k ★
m
開源工程 · AI Agent 記憶層

AI 編碼代理的
持久記憶層

agentmemory 為 AI 編碼代理(Claude Code、Cursor、Gemini CLI 等 16 種)補上一層持久、可搜尋的記憶。它在背景側錄每一次工具呼叫,把觀察壓縮成結構化記憶,並在新 session 開場時把相關脈絡注入回去。這份手冊說明 30 秒安裝步驟、四層記憶架構,以及「記住、回想」的完整操作流程。

16.1k
GitHub Stars
16
支援的 AI 代理
95.2%
R@5 檢索準確率
Apache
2.0 開源授權
01
這到底是什麼

agentmemory:AI 代理的跨 session 記憶伺服器

AI 編碼代理沒有跨 session 的記憶。關掉視窗,前一輪累積的脈絡就清空了,下一次必須重新說明架構、重新發現同一個 bug、重新告知偏好設定。多數人的對策是手寫一份 CLAUDE.md.cursorrules,但依 README 說明:這種內建記憶約 200 行即達上限,且隨時間過時

agentmemory 是一個在背景執行的記憶伺服器,搭配 12 個 hooks 自動側錄代理的每一次工具呼叫。觀察會被去重(SHA-256)、過濾隱私、用 LLM 壓縮、嵌入向量,再寫進索引。下一個 session 開場時,相關脈絡會自動注入回去,代理不需要再次提問即可取得上下文。

設計上它延伸自 Karpathy 的 LLM Wiki 模式,加入信心評分、生命週期管理與知識圖譜。記憶分四層整併:原始觀察為 Working,壓縮後的 session 摘要為 Episodic,萃取出的事實與模式為 Semantic,沉澱下來的工作流程為 Procedural。記憶依 Ebbinghaus 遺忘曲線衰減,常被取用的強度增加,陳舊的自動淘汰,矛盾的由系統偵測並化解。

agentmemory · 一次工具呼叫的記憶生命週期
側錄 Capture 壓縮 Compress 索引 Index 注入 Inject 回想 Recall
「You explain the same architecture every session. You re-discover the same bugs. You re-teach the same preferences.」每個 session 重複解釋相同的架構決定、重新發現相同的 bug,是 agentmemory 要解決的核心問題。
— agentmemory README,問題陳述段落
02
30 秒安裝

一行 npx 啟動記憶伺服器,連線由 hooks 自動完成

最快的路徑是 npx,不需要全域安裝即可啟動記憶伺服器,運行於本機 :3111。第二行的 demo 會灌入幾段範例 session,當場示範回想能力,方便在接上正式專案前先確認效果。

# 30 秒體驗:啟動伺服器並看一次回想示範 npx @agentmemory/agentmemory npx @agentmemory/agentmemory demo

正式安裝:全域安裝並接上代理

長期使用建議全域安裝,再用 connect 把記憶層接到指定代理。connect 會自動寫好設定:Claude Code 取得 12 個自動側錄 hooks,Cursor、Gemini CLI、Cline 等則接上 MCP 伺服器。

npm install -g @agentmemory/agentmemory agentmemory # 啟動記憶伺服器於 :3111 agentmemory connect claude-code # 接上代理(也支援 cursor / codex / gemini-cli …)
環境需求:Node.js 20 以上;macOS、Linux 可直接執行,Windows 10/11 需另備 iii-engine 二進位檔或 Docker Desktop。整套無外部資料庫依賴,SQLite 加上內建的 iii-engine 即可運作,不需要 Postgres、Redis 或向量資料庫。安裝後若不確定狀態,執行 agentmemory doctor 進行互動式診斷。
03
指令與工具總覽

CLI 指令、51 個 MCP 工具與斜線指令分類說明

agentmemory 的能力分三類:命令列工具(安裝、連接、診斷)、51 個 MCP 工具(8 個核心、43 個延伸,負責讀寫與治理記憶),以及斜線指令(在對話中直接呼叫記憶)。以下卡片列出最常用的一組。熟悉 memory_recallmemory_smart_searchmemory_save 這三個工具並搭配自動側錄 hooks,可覆蓋日常九成用法。

CLI · 01
agentmemory
記憶伺服器
啟動本機記憶伺服器於 :3111。一台伺服器服務所有代理,零外部資料庫。
CLI · 02
agentmemory connect
代理接線員
把記憶層接到指定代理。自動寫好 Claude Code 的 hooks,或 Cursor、Gemini CLI 的 MCP 設定。
CLI · 03
agentmemory demo
回想示範
灌入範例 session 並當場證明回想能力。先看到效果,再決定是否信任。
CLI · 04
agentmemory doctor
互動診斷
逐項檢查環境與連線,遇到問題給出修復提示。安裝卡住時第一個跑它。
Capture · 05
12 hooks
自動側錄
SessionStartPostToolUseStop,在生命週期各點側錄,完全不需手動。
Capture · 06
agentmemory import-jsonl
歷史回填
匯入舊的 Claude Code JSONL 對話記錄,讓記憶從第一天就不是空的。
Recall · 07
memory_recall
過往觀察查詢
搜尋過去側錄的觀察。代理要回想「上次怎麼做」時的第一道入口。
Recall · 08
memory_smart_search
混合檢索引擎
BM25 關鍵字加向量嵌入加知識圖譜,以 RRF 融合排序。LongMemEval-S 上 R@5 達 95.2%。
Recall · 09
memory_save · /remember
主動寫入
把一個決定、洞察或模式手動存進長期記憶。自動側錄之外,你也能親手標記重點。
Govern · 10
memory_consolidate
四層整併
把 Working 觀察逐層提煉成 Episodic、Semantic、Procedural。記憶從雜訊變知識。
Govern · 11
memory_graph_query
知識圖譜遍歷
沿著概念、檔案、決策之間的關係走查,而不只是比對關鍵字。
Coordinate · 12
memory_lease · memory_signal_send
多代理協作
用 leases 鎖定獨佔動作、用 signals 在代理間傳訊。多個代理共用同一層記憶不打架。

四層記憶,一張表看懂

記憶分層整併:越上層越接近可直接行動的知識。memory_consolidate 負責把下層提煉成上層。

層級 內容 對應的人類記憶
Working 來自工具呼叫的原始觀察 短期記憶
Episodic 壓縮後的 session 摘要 「發生過什麼」
Semantic 萃取出的事實與模式 「我知道什麼」
Procedural 沉澱下來的工作流程與決策模式 「該怎麼做」
04
進階設定 · README / Docs

六項官方文件建議的進階配置

以下六項設定來自 README 與官方設定文件,對 token 成本、context 壓縮存活率與隱私三方面有明顯影響。所有旗標均來自官方文件,未加入未經查證的參數。

TIP 01

先跑 demo,再決定信不信

安裝後執行 npx @agentmemory/agentmemory demo。它會灌入範例 session 並示範回想結果。確認回想到正確脈絡後,再把它接到正式專案。

來源 · 官方 README · Quick Start
TIP 02

用環境變數控制工具數量

51 個 MCP 工具不一定都要曝露給代理。設 AGENTMEMORY_TOOLS=core 只保留 8 個核心工具,省下 context;要完整治理能力時再切 AGENTMEMORY_TOOLS=all 解鎖全部。

來源 · 官方 README · MCP 設定
TIP 03

用 import-jsonl 回填歷史

不想從空白記憶開始?agentmemory import-jsonl 會匯入你過去的 Claude Code JSONL 對話記錄。裝好的第一天,代理就帶著你先前的決策與架構脈絡。

來源 · 官方 README · CLI 指令
TIP 04

接本機嵌入,token 成本歸零

README 的成本表寫得很清楚:agentmemory 一年約 17 萬 token($10 等級);若改用本機嵌入模型,檢索的嵌入成本直接降到 $0。長期專案值得切過去。

來源 · 官方 README · 成本對照表
TIP 05

用 <private> 標籤擋住敏感內容

agentmemory 會在寫入前自動剝除 API key 與密鑰。如需更精確地控制,把不想被記住的段落包進 <private> 標籤,標籤內的內容不會進入記憶儲存。

來源 · 官方 README · 隱私說明
TIP 06

PreCompact hook 讓記憶撐過壓縮

Claude Code 的 context 壓縮後,原有脈絡會稀釋。agentmemory 的 PreCompact hook 會在壓縮前把記憶重新注入,使長對話中途也能保留完整上下文。

來源 · 官方 README · Hooks 清單
05
實戰演練

跨 session 記憶保留的實際操作流程

以下情境直接取自 README:Session 1 你請代理接好 JWT 驗證;Session 2 隔天回來,你只說「加上 rate limiting」。看 agentmemory 怎麼讓代理在你開口前就已經知道你的 auth 用了什麼、測試蓋了哪些、為什麼這樣選。

~/projects/api · claude code · agentmemory
── SESSION 1 · 週一 ──────────────────────────────
[SessionStart hook · 載入專案 · 記憶為空]
You › 幫我在這個 API 接上 JWT 驗證,要能在 Edge runtime 跑。
Claude › 我會用 jose 做 middleware,它沒有 Node 內建模組依賴, 在 Edge runtime 比 jsonwebtoken 安全。寫進 auth.ts。
[PostToolUse hook · 側錄 Write src/middleware/auth.ts] [PostToolUse hook · 側錄 Write tests/auth.test.ts] [去重 SHA-256 · 過濾隱私 · LLM 壓縮 · 嵌入 · 索引]
You › /remember 選 jose 是因為 Edge runtime 相容性 [memory_save · Semantic 層 · 已存入決策理由]
[Stop hook · session 摘要 · 萃取知識圖譜 · 關閉]
── SESSION 2 · 週二 ──────────────────────────────
[SessionStart hook · 注入上一輪相關記憶]
You › 幫這個 API 加上 rate limiting。
Claude › 先回想一下這個專案的脈絡,
→ memory_smart_search("auth rate limiting api") [BM25 + 向量 + 知識圖譜 · RRF 融合 · 14ms]
命中 3 則記憶: · auth 用 jose middleware,位於 src/middleware/auth.ts · 測試 tests/auth.test.ts 已覆蓋 token 驗證 · 決策:選 jose 而非 jsonwebtoken(Edge 相容性)
Claude › 我已經知道你的 auth 結構。rate limiting 我會接在 同一條 auth.ts middleware 鏈上,維持 Edge 相容, 並沿用你既有的測試風格補 regression test。 不需要你再解釋一次架構。
實作完成 · 沿用 jose 鏈 · 測試 +6 · 與既有風格一致
Session 2 你問 rate limiting,代理已知道 auth 用 jose middleware、測試覆蓋範圍,以及選 jose 的原因,不需要再次說明架構。
— agentmemory README,跨 session 記憶保留範例說明

這段流程為什麼關鍵

整段流程中,memory_* 指令全由系統自動呼叫。hooks 在背景側錄,代理在 Session 2 開場時自行呼叫 memory_smart_search。唯一一次主動介入是用 /remember 標記「為什麼選 jose」的決策理由,將其釘進 Semantic 層。

記憶保留的不只是檔案內容,而是決策理由。代理知道 jose 是刻意的取捨,下一輪不會建議替換。這種連續性使跨 session 的工作品質保持一致。

06
注意事項

安裝與使用前需確認的已知限制

  • 需要 Node.js 20 以上。低於這個版本伺服器跑不起來。先 node -v 確認,再 agentmemory doctor 做完整環境檢查。
  • Windows 安裝較費工。沒有原生 scoop / winget 套件,要手動取得 iii-engine 二進位檔,或改用 Docker Desktop 當後備。能用 WSL2 就用 WSL2。
  • iii-engine 版本被釘死。agentmemory 把底層 iii-engine 鎖在 v0.11.2;v0.11.6 以後的 sandbox 模型需要尚未完成的重構,不要自行升級 iii-engine。
  • 觀察視窗只綁本機,別對外開。即時觀察視窗(:3113)與 iii console 都綁在 127.0.0.1,而 iii console 本身沒有驗證。絕不要把這些連接埠暴露到公網。
  • 受保護端點要自己設密鑰。設了 AGENTMEMORY_SECRET 後,受保護的 REST 端點才會要求 Authorization: Bearer。多人或非本機環境務必設定。
  • 沙箱化的 MCP 客戶端要開 proxy。某些被沙箱隔離的 MCP 客戶端連不到 host 的 localhost,需設 AGENTMEMORY_FORCE_PROXY=1 才能接到記憶伺服器。
  • 記憶會衰減,不是永久檔案庫。記憶依 Ebbinghaus 曲線淘汰陳舊項目。若有想長期保留的內容,用 memory_export 定期匯出,別把它當備份系統。
  • 仍是 1.0 之前的版本。目前在 v0.9.x 階段、快速迭代中。先用 demo 驗證回想品質,接上關鍵專案前留一份自己的脈絡備份。
07
進階路徑

多代理協作與治理工具的擴展路徑

把基本回想跑順之後,agentmemory 真正的縱深在多代理協作治理。同一台記憶伺服器服務所有代理,意味著你可以讓多個 AI 共用一份脈絡,而不是各記各的。

進階玩法地圖

1. 解鎖完整工具面。AGENTMEMORY_TOOLS=all 把 MCP 工具從 8 個核心擴到 51 個,拿到 memory_consolidatememory_auditmemory_graph_query 等治理與稽核能力。

2. 讓多個代理協作。memory_lease 鎖定獨佔動作、memory_signal_sendmemory_signal_read 在代理間傳訊、memory_mesh_sync 在多個 agentmemory 實例間做 P2P 同步。

3. 與團隊共享記憶。memory_team_share 讓專案知識不再鎖在個人機器上;新進同事接上同一台伺服器,就承接整個專案的決策史。

4. 把 token 成本壓到零。改用本機嵌入模型,檢索的嵌入成本歸零,記憶系統的長期持有成本接近免費。

5. 用 iii 原語擴充。底層 iii-engine 支援 iii worker add,可加入 pubsub、cron、佇列、可觀測性、沙箱與 SQL 後端,將記憶層擴展為更完整的代理基礎設施。

最該讀的三份延伸閱讀

github.com/rohitg00/agentmemory:主 README,包含完整 CLI、MCP 工具、hooks 與成本對照。
agentmemory / releases:版本紀錄,確認安裝版本與已修復的問題。
github.com/iii-hq/iii:底層 iii-engine,說明記憶伺服器的執行模型與擴充點。

內建記憶(CLAUDE.md、.cursorrules)約 200 行即達上限,且隨時間過時。agentmemory 以自動側錄與分層整併解決這項限制。
— agentmemory README,內建記憶限制說明段落