公司大腦 · OPERATING MAP
AI 代理的記憶基礎建設 · 六階段拆解

公司大腦
操作地圖.

記憶是原料,檢索才是操作層。提升 AI 代理輸出品質的關鍵,在於「在正確時刻提供正確脈絡,並透過正確的權限控制存取」。這份指南將 The Company Brain Operating Map 拆解為六個可落地的操作階段。

主題 · Context Engineering 難度 · 入門到進階 適用 · AI 代理/知識庫/工作流自動化 更新 · 2026.05

Context Flow

脈絡流:原始資料進入系統。

Trust Flow

信任流:經驗證、可使用的內容。

Permission Flow

權限流:界定什麼能被使用。

Feedback Flow

回饋流:更正回流,成為規則。

00

Context Engineering:2026 年值得投入的 AI 基礎建設

大多數團隊導入 AI 代理時,第一個動作是調整 prompt。Demo 流暢,進入真實場景後問題出現:使用者引用兩週前的決策,模型因檢索到過期文件而產生幻覺,回答流於通用。調整三次 prompt 後問題依舊存在。根本原因不在 prompt,而在脈絡(context)管理

業界正從 Prompt Engineering 轉向 Context Engineering。Prompt 是模型輸入裡的一段指令;Context Engineering 管理的是整段輸入,包括系統指令、記憶、檢索文件、工具輸出、對話歷史與使用者狀態。Prompt 定義模型角色,Context Engineering 決定模型此刻可用的資訊。

擴大 context window 並非萬用解法。輸入內容過多會導致脈絡腐爛(context rot):注意力被稀釋、舊資訊被視為現況、準確度下降。依據 2026 年的實務分析,過量脈絡可使準確度降至約三成。視窗更大,但訊號雜訊比不改善,輸出品質同樣不會提升。

「公司大腦操作地圖」將這個問題拆解為一條可操作的生產線:擷取 → 檢索 → 來源治理 → 權限 → 回饋迴路 → 執行。以下逐一說明。

01

起點:四散的公司脈絡

公司每天都在產生訊號,但它們散落在各處。沒被連起來的脈絡,就是被遺失的脈絡。

SRC / 01

Slack 對話串

決策、更新、提問、回答。

SRC / 02

通話紀錄(Gong)

客戶對話、Demo、異議、洞察。

SRC / 03

CRM 紀錄(HubSpot)

聯絡人、交易、活動、備註。

SRC / 04

SOP 流程文件

流程文件、playbook、檢查清單。

SRC / 05

銷售筆記

探詢、跟進、異議、承諾事項。

SRC / 06

內容決策

主題、切角、論證、定位。

SRC / 07

領導層更正

策略修改、語氣修正、禁區(no-go)。

SRC / 08

每日紀錄

發生了什麼、改了什麼、下一步。

02

六大操作階段

每個階段對應一個具體的失效點。六個階段完整實作後,系統品質會隨使用累積而提升。

1

擷取

CAPTURE — Raw material enters the system

擷取是把工作的痕跡留下來:紀錄工作、把通話轉成逐字稿、記下決策、保存每一次更正、收集工作流產出、保留來源中繼資料(誰說的、何時說的)。

設計原則:擷取是「儲存」,不是「判斷」。這一層的職責是確保不遺漏,判斷工作留給後段的檢索與來源治理。

  • 紀錄工作、轉錄通話
  • 記下決策、保存更正
  • 收集工作流產出
  • 保留來源中繼資料
2

檢索

RETRIEVAL — The operating layer

檢索是整張圖的核心操作層:在任務發生的當下提供對應脈絡、只取與任務相關的片段、避免脈絡膨脹、減少使用者重複解釋背景。

代理不需要知道全部,只需要那 6 個關鍵片段。RAG(檢索增強生成)的核心邏輯是:先查到正確資料,再根據證據作答,而不是依賴訓練記憶推測。

▸ 研究指出,良好的檢索接地可將幻覺率降低約 70–90%,因為答案被綁定在被檢索出的證據上。
  • 此刻給出對的脈絡
  • 任務專屬的記憶
  • 只拉重要的、避免脈絡膨脹
  • 減少人類重新解釋
⌁ 觀念釐清

RAG 是「依查詢即時檢索」,Memory 是「跨對話持久保存的狀態」。多數場景兩者並用。

3

真相來源

SOURCE TRUTH — Who wins on conflict

當兩份資料衝突時,哪一份優先?即時 CRM vs. 舊 SOP、通話逐字稿 vs. Slack 更正、公開可用 vs. 內部限定、歷史脈絡 vs. 當前紀錄,必須先定義來源階層(source hierarchy)

核心原則:檢索負責縮小候選範圍,治理負責定義哪份資料有效。當過期草稿與正式政策同時可被檢索到,prompt 無法可靠判斷哪份才算數。

▸ 生成式 AI 約有 3–10% 的輸出是憑空捏造;在法務情境甚至可達 34%。導入治理化的脈絡層,可把幻覺率再砍超過 40%
  • 哪個來源說了算?
  • 即時 CRM vs. 舊 SOP
  • 逐字稿 vs. Slack 更正
  • 歷史脈絡 vs. 當前真相
⚠ 陷阱

未定義來源階層時,代理在衝突的資料間無依據可循,輸出信心標示與準確度脫鉤。

4

權限

PERMISSIONS — The brain needs walls

誰能看到什麼?工作流層級的存取、客戶脈絡邊界、HR/財務封鎖、公開內容的安全標記,都需要明確定義。每個工作流只取得對應的脈絡範圍,而不是讓所有資料共用同一個存取層。

權限控制同時具備防幻覺效果:列級(row-level)、欄級(column-level)的存取控制將代理限制在既有權限模型內,來源範圍縮小後,後段驗證的成本也隨之降低。

  • 誰能看到什麼
  • 工作流層級存取
  • 客戶脈絡邊界
  • HR/財務封鎖、公開內容安全
⚠ 陷阱

缺少存取控制的記憶系統,不同工作流、客戶、敏感度的資料會互相干擾,且難以稽核。

5

回饋迴路

FEEDBACK LOOPS — Corrections become rules

每一次更正都應沉澱為一條規則:語氣規則、來源優先級規則、CRM 風險規則、路由規則,讓重複出現的錯誤有機制防止再發。

依據多項研究,寫在 prompt 裡的自然語言規則只是建議,不構成約束。要讓更正生效,需將其轉為符號規則、schema 或驗證層,模型才無法繞過。

  • 更正 → 變成規則
  • 語氣/來源規則更新
  • CRM 風險規則更新
  • 重複的錯誤逐漸消失
↻ 原則

每次更正沉澱為規則後,同類錯誤的再發機率下降,系統品質隨使用累積而提升。

6

執行

EXECUTION — Work gets done

前五階段到位後,執行端的效益直接體現:代理啟動時已有相關脈絡、報告產出內含來源標註、流程審查能識別風險、通話洞察可轉為可重用的 playbook、操作者不需重複提供背景資訊。

工作的完成方式改變:有脈絡支撐、有證據標註、來回次數減少。

  • 代理一啟動就更聰明
  • 內容自帶證據層
  • 通話洞察變成 playbook
  • 操作者不必從零開始
03

失效模型與可運作模型的對照

兩種模型的差異在於:資料來源是否整合、更正是否沉澱為規則。

BROKEN — 每次都從冷啟動開始
Prompt提示
Output輸出
Scattered Feedback四散的回饋
Lost Decision遺失的決策
Restart重新開始
WORKING — 下一次更好
Calls / CRM / SOP / Slack連起來的來源
Retrieval對的脈絡
Agent聰明啟動
Work產出物
Correction審查
Rule沉澱成規則
04

自動化前的六項審計問題

將工作流交給代理之前,用這份清單確認基礎架構是否到位。

1

這個工作流需要哪些來源?

先盤點,再決定要連什麼進來。

2

當來源衝突時,哪個贏?

這就是你的來源階層。

3

哪些脈絡是「永遠必備」?

每次都要載入的核心脈絡。

4

哪些脈絡「永遠不該用」?

權限與禁區,明確封鎖。

5

哪些更正會重複出現?

重複的更正最值得變成規則。

6

一次更正如何變成規則?

定義「更正 → 規則」的機制。

05

六條操作守則

RULE 1

擷取是儲存,不是智慧。

RULE 2

精準檢索的效果優於擴大記憶容量。

RULE 3

來源治理定義哪份資料有效,防止信心與準確度脫鉤。

RULE 4

權限控制限定代理的存取範圍,確保可稽核性。

RULE 5

每次更正應沉澱為符號規則或 schema,而非只更新 prompt。

RULE 6

系統品質應隨使用次數累積,而非每次重置。

·

累積型的操作效益

更快的決策

帶著脈絡行動,而不是猜。

更乾淨的交接

少了重複解釋,更清晰。

更好的代理產出

相關、準確、有證據。

更少脈絡切換

維持心流,交付更快。

更少重複更正

修一次,系統就記住。

機構記憶持續累積

決策與更正形成可查詢的資產。

單一真相來源
決策被記錄
脈絡被策展
存取被控制
回饋被複利
記憶是競爭優勢
06

社群實戰:來自 Reddit、HN 與工程圈的 tips 與踩雷紀錄

以下整理自 2026 年社群討論與實務文章(Hacker News、Reddit r/LocalLLaMA、r/LLMDevs、DEV、產業部落格),以自身語言重述要點。

TIP · 觀念

擴大 context window 無法解決脈絡腐爛問題

社群討論中的常見共識:輸入過多導致脈絡腐爛(context rot),準確度反而下降。建議先實作「只取 6 個關鍵片段」的檢索策略,再評估是否需要更大的視窗。

TIP · 架構

分清 RAG 與 Memory

RAG 像超強搜尋、不帶個人化;Memory 是跨對話可讀寫、會「累積經驗」。客服 FAQ 用 RAG,個人化助理需要 Memory,多數場景兩者並用。

PITFALL · 踩雷

來源治理缺位時,prompt 無法彌補

常見事故:草稿、舊政策、正式版本同時可被檢索,模型摘要出錯誤內容且信心標示為高。解決順序是先定義來源權威,再調整 prompt。

PITFALL · 踩雷

prompt 是建議,不是約束

把「最多 10 人」寫在 docstring 裡,代理照樣 book(15)。要用符號規則/schema 驗證/工具層強制,而不是寄望模型自律。

HACK · 實作

「無證據,不作答」:單一規則可防止整類錯誤

強制每個結論對應到被檢索的來源證據,無法對應時回覆「無可靠來源」。一條規則可阻擋大量高信心錯誤輸出。拒絕作答的代價低於輸出錯誤結論。

HACK · 實作

每個片段都附中繼資料:標題+日期+來源層級

chunk 入庫時就標好 metadata,檢索時才有辦法做來源階層裁決與信心標註,也讓答案可追溯、可稽核。

HACK · 進階

用多代理/Plan-Do-Check 互相挑錯

單一代理在孤立中幻覺、沒人抓得到。讓「執行者/懷疑者/裁決者」分工辯論,或用 Plan→Do→Check 的巢狀審查,在送到使用者之前先抓錯。

HACK · 成本

向量過濾工具選擇與脈絡壓縮

依據社群回報,以向量過濾只選取相關工具,token 用量可下降 80% 以上。配合摘要式壓縮,保留完成任務所需的最少 token。

USE CASE · 客服

歷史工單 + 文件即時回答

對過往工單與說明文件做向量檢索,當場給出準確答覆。Intercom 的 Fin、Atlassian Intelligence 都是這種 RAG 的正式上線案例。

USE CASE · 法務

先檢索最相關的 10 個判例再摘要

別把 200 頁法條整個倒給模型(又貴又慢又空泛)。先用向量搜尋取前 10 相關案例,逐一摘成結構化筆記再綜合。實務報告:準確度 +27%、成本 −40%。

USE CASE · 業務

通話洞察 → 可重用 playbook

把 Gong 通話逐字稿的異議與成交模式擷取出來,沉澱成業務 playbook,新人不必每次從零開始學。

USE CASE · 工程

給 Triage 代理一個長期記憶

用向量庫記住過去的 GitHub issue,新進 issue 自動比對、標出可能的重複,省下兩個工程師查同一個 bug 的浪費。

07

Prompt 設計範例:遵守來源階層的檢索代理

將六個階段濃縮為可直接套用的系統提示骨架。核心要素為:來源階層、權限邊界、無證據不作答、更正轉規則

company-brain-retrieval-agent.system.md
# 角色
你是「公司大腦」檢索代理,服務於:{{工作流名稱}}。
你的任務是用已驗證的公司脈絡作答,而不是憑訓練記憶硬猜。

# 來源階層(衝突時,由高到低優先採用)
1. 即時系統真相          # 例:HubSpot 當前紀錄
2. 最新的領導層更正      # 被標記為 [RULE] 的內容
3. 現行 SOP / Playbook   # 注意版本日期,舊版不算數
4. 通話逐字稿 / Slack    # 僅作佐證,不可凌駕 1–3

# 權限邊界(硬規則,不可協商)
- 僅可使用標記為 [PUBLIC-SAFE] 或 [本工作流可見] 的內容。
- 嚴禁引用 [HR] / [FINANCE] / [INTERNAL-ONLY] 來源。
- 不同客戶的脈絡不可混用。

# 檢索原則
- 只取與當前任務最相關的 6 個片段,避免脈絡膨脹。
- 每個關鍵主張都要能對應到具體來源(標題 + 日期)。

# 輸出規則
- 無證據,不作答:若無可靠來源支持,回覆
  「目前沒有可靠來源,建議向 {{負責人}} 確認」。
- 對每個關鍵結論標註信心:高 / 中 / 低。
- 來源衝突時,明說「採用了哪一個、捨棄了哪一個、為什麼」。

# 回饋(讓更正變成規則)
- 若使用者更正你,將更正濃縮成一條可重用規則,
  輸出在 <new_rule> ... </new_rule> 標籤中,
  以便寫回規則庫,下次自動生效。

小提醒:上面的 {{變數}} 請替換成你實際的工作流、負責人與來源標籤。權限與來源階層最好同時用「系統層的存取控制」雙重把關,不要只靠這段文字。

08

30 天導入路線圖

選擇一個使用頻率高、失效點明確的工作流,先完整跑過六個階段一次,再擴展到其他工作流。

Week 1 · 擷取 & 盤點

選一個工作流,把來源連起來

用前面的審計 6 題,盤點這個工作流需要哪些來源。開始擷取:通話轉錄、決策紀錄、更正存檔,並為每個片段標好中繼資料(標題、日期、來源層級)。

Week 2 · 檢索 & 真相來源

建最小可用的 RAG,並寫下來源階層

把資料切塊、做嵌入、入向量庫。明確定義衝突時誰說了算。導入「只取 6 個關鍵片段」與「無證據不作答」。

Week 3 · 權限 & 護欄

加上存取控制與輸出驗證

用列級/欄級權限把代理關進既有權限模型;封鎖 HR/財務等禁區。對輸出加 schema 驗證與信心標註,讓「有自信的錯」無法溜出去。

Week 4 · 回饋 & 複利

讓更正變成規則,量測成效

建立「更正 → 規則」的機制(new_rule 寫回規則庫)。量測幻覺率、解決時間、來回次數的變化,再把這套模板複製到下一個工作流。

六階段總結

將零散的公司脈絡整合為 AI 代理可用的記憶系統,關鍵在於正確時刻、正確脈絡、正確權限的組合。擷取確保不遺漏,檢索提供對應片段,來源治理定義有效資料,權限控制範圍,回饋迴路讓更正沉澱為規則,執行端產出帶有來源標註的結果。記憶是原料,檢索是操作層;機構記憶隨使用累積,形成可查詢的知識資產。