agentmemory 為 AI 編碼代理(Claude Code、Cursor、Gemini CLI 等 16 種)補上一層持久、可搜尋的記憶。它在背景側錄每一次工具呼叫,把觀察壓縮成結構化記憶,並在新 session 開場時把相關脈絡注入回去。這份手冊說明 30 秒安裝步驟、四層記憶架構,以及「記住、回想」的完整操作流程。
AI 編碼代理沒有跨 session 的記憶。關掉視窗,前一輪累積的脈絡就清空了,下一次必須重新說明架構、重新發現同一個 bug、重新告知偏好設定。多數人的對策是手寫一份 CLAUDE.md 或 .cursorrules,但依 README 說明:這種內建記憶約 200 行即達上限,且隨時間過時。
agentmemory 是一個在背景執行的記憶伺服器,搭配 12 個 hooks 自動側錄代理的每一次工具呼叫。觀察會被去重(SHA-256)、過濾隱私、用 LLM 壓縮、嵌入向量,再寫進索引。下一個 session 開場時,相關脈絡會自動注入回去,代理不需要再次提問即可取得上下文。
設計上它延伸自 Karpathy 的 LLM Wiki 模式,加入信心評分、生命週期管理與知識圖譜。記憶分四層整併:原始觀察為 Working,壓縮後的 session 摘要為 Episodic,萃取出的事實與模式為 Semantic,沉澱下來的工作流程為 Procedural。記憶依 Ebbinghaus 遺忘曲線衰減,常被取用的強度增加,陳舊的自動淘汰,矛盾的由系統偵測並化解。
最快的路徑是 npx,不需要全域安裝即可啟動記憶伺服器,運行於本機 :3111。第二行的 demo 會灌入幾段範例 session,當場示範回想能力,方便在接上正式專案前先確認效果。
長期使用建議全域安裝,再用 connect 把記憶層接到指定代理。connect 會自動寫好設定:Claude Code 取得 12 個自動側錄 hooks,Cursor、Gemini CLI、Cline 等則接上 MCP 伺服器。
agentmemory doctor 進行互動式診斷。
agentmemory 的能力分三類:命令列工具(安裝、連接、診斷)、51 個 MCP 工具(8 個核心、43 個延伸,負責讀寫與治理記憶),以及斜線指令(在對話中直接呼叫記憶)。以下卡片列出最常用的一組。熟悉 memory_recall、memory_smart_search、memory_save 這三個工具並搭配自動側錄 hooks,可覆蓋日常九成用法。
:3111。一台伺服器服務所有代理,零外部資料庫。SessionStart 到 PostToolUse 到 Stop,在生命週期各點側錄,完全不需手動。
記憶分層整併:越上層越接近可直接行動的知識。memory_consolidate 負責把下層提煉成上層。
| 層級 | 內容 | 對應的人類記憶 |
|---|---|---|
Working |
來自工具呼叫的原始觀察 | 短期記憶 |
Episodic |
壓縮後的 session 摘要 | 「發生過什麼」 |
Semantic |
萃取出的事實與模式 | 「我知道什麼」 |
Procedural |
沉澱下來的工作流程與決策模式 | 「該怎麼做」 |
以下六項設定來自 README 與官方設定文件,對 token 成本、context 壓縮存活率與隱私三方面有明顯影響。所有旗標均來自官方文件,未加入未經查證的參數。
安裝後執行 npx @agentmemory/agentmemory demo。它會灌入範例 session 並示範回想結果。確認回想到正確脈絡後,再把它接到正式專案。
51 個 MCP 工具不一定都要曝露給代理。設 AGENTMEMORY_TOOLS=core 只保留 8 個核心工具,省下 context;要完整治理能力時再切 AGENTMEMORY_TOOLS=all 解鎖全部。
不想從空白記憶開始?agentmemory import-jsonl 會匯入你過去的 Claude Code JSONL 對話記錄。裝好的第一天,代理就帶著你先前的決策與架構脈絡。
README 的成本表寫得很清楚:agentmemory 一年約 17 萬 token($10 等級);若改用本機嵌入模型,檢索的嵌入成本直接降到 $0。長期專案值得切過去。
來源 · 官方 README · 成本對照表agentmemory 會在寫入前自動剝除 API key 與密鑰。如需更精確地控制,把不想被記住的段落包進 <private> 標籤,標籤內的內容不會進入記憶儲存。
Claude Code 的 context 壓縮後,原有脈絡會稀釋。agentmemory 的 PreCompact hook 會在壓縮前把記憶重新注入,使長對話中途也能保留完整上下文。
以下情境直接取自 README:Session 1 你請代理接好 JWT 驗證;Session 2 隔天回來,你只說「加上 rate limiting」。看 agentmemory 怎麼讓代理在你開口前就已經知道你的 auth 用了什麼、測試蓋了哪些、為什麼這樣選。
整段流程中,memory_* 指令全由系統自動呼叫。hooks 在背景側錄,代理在 Session 2 開場時自行呼叫 memory_smart_search。唯一一次主動介入是用 /remember 標記「為什麼選 jose」的決策理由,將其釘進 Semantic 層。
記憶保留的不只是檔案內容,而是決策理由。代理知道 jose 是刻意的取捨,下一輪不會建議替換。這種連續性使跨 session 的工作品質保持一致。
node -v 確認,再 agentmemory doctor 做完整環境檢查。
v0.11.2;v0.11.6 以後的 sandbox 模型需要尚未完成的重構,不要自行升級 iii-engine。
:3113)與 iii console 都綁在 127.0.0.1,而 iii console 本身沒有驗證。絕不要把這些連接埠暴露到公網。
AGENTMEMORY_SECRET 後,受保護的 REST 端點才會要求 Authorization: Bearer。多人或非本機環境務必設定。
AGENTMEMORY_FORCE_PROXY=1 才能接到記憶伺服器。
memory_export 定期匯出,別把它當備份系統。
demo 驗證回想品質,接上關鍵專案前留一份自己的脈絡備份。
把基本回想跑順之後,agentmemory 真正的縱深在多代理協作與治理。同一台記憶伺服器服務所有代理,意味著你可以讓多個 AI 共用一份脈絡,而不是各記各的。
1. 解鎖完整工具面。設 AGENTMEMORY_TOOLS=all 把 MCP 工具從 8 個核心擴到 51 個,拿到 memory_consolidate、memory_audit、memory_graph_query 等治理與稽核能力。
2. 讓多個代理協作。用 memory_lease 鎖定獨佔動作、memory_signal_send 與 memory_signal_read 在代理間傳訊、memory_mesh_sync 在多個 agentmemory 實例間做 P2P 同步。
3. 與團隊共享記憶。memory_team_share 讓專案知識不再鎖在個人機器上;新進同事接上同一台伺服器,就承接整個專案的決策史。
4. 把 token 成本壓到零。改用本機嵌入模型,檢索的嵌入成本歸零,記憶系統的長期持有成本接近免費。
5. 用 iii 原語擴充。底層 iii-engine 支援 iii worker add,可加入 pubsub、cron、佇列、可觀測性、沙箱與 SQL 後端,將記憶層擴展為更完整的代理基礎設施。
① github.com/rohitg00/agentmemory:主 README,包含完整 CLI、MCP 工具、hooks 與成本對照。
② agentmemory / releases:版本紀錄,確認安裝版本與已修復的問題。
③ github.com/iii-hq/iii:底層 iii-engine,說明記憶伺服器的執行模型與擴充點。