公司大腦操作地圖｜Context Engineering 六階段實作指南

Context Engineering：2026 年值得投入的 AI 基礎建設

大多數團隊導入 AI 代理時，第一個動作是調整 prompt。Demo 流暢，進入真實場景後問題出現：使用者引用兩週前的決策，模型因檢索到過期文件而產生幻覺，回答流於通用。調整三次 prompt 後問題依舊存在。根本原因不在 prompt，而在脈絡（context）管理。

業界正從 Prompt Engineering 轉向 Context Engineering。Prompt 是模型輸入裡的一段指令；Context Engineering 管理的是整段輸入，包括系統指令、記憶、檢索文件、工具輸出、對話歷史與使用者狀態。Prompt 定義模型角色，Context Engineering 決定模型此刻可用的資訊。

擴大 context window 並非萬用解法。輸入內容過多會導致脈絡腐爛（context rot）：注意力被稀釋、舊資訊被視為現況、準確度下降。依據 2026 年的實務分析，過量脈絡可使準確度降至約三成。視窗更大，但訊號雜訊比不改善，輸出品質同樣不會提升。

「公司大腦操作地圖」將這個問題拆解為一條可操作的生產線：擷取 → 檢索 → 來源治理 → 權限 → 回饋迴路 → 執行。以下逐一說明。

起點：四散的公司脈絡

公司每天都在產生訊號，但它們散落在各處。沒被連起來的脈絡，就是被遺失的脈絡。

SRC / 01

Slack 對話串

決策、更新、提問、回答。

SRC / 02

通話紀錄（Gong）

客戶對話、Demo、異議、洞察。

SRC / 03

CRM 紀錄（HubSpot）

聯絡人、交易、活動、備註。

SRC / 04

SOP 流程文件

流程文件、playbook、檢查清單。

SRC / 05

銷售筆記

探詢、跟進、異議、承諾事項。

SRC / 06

內容決策

主題、切角、論證、定位。

SRC / 07

領導層更正

策略修改、語氣修正、禁區（no-go）。

SRC / 08

每日紀錄

發生了什麼、改了什麼、下一步。

六大操作階段

每個階段對應一個具體的失效點。六個階段完整實作後，系統品質會隨使用累積而提升。

擷取

CAPTURE — Raw material enters the system

擷取是把工作的痕跡留下來：紀錄工作、把通話轉成逐字稿、記下決策、保存每一次更正、收集工作流產出、保留來源中繼資料（誰說的、何時說的）。

設計原則：擷取是「儲存」，不是「判斷」。這一層的職責是確保不遺漏，判斷工作留給後段的檢索與來源治理。

紀錄工作、轉錄通話
記下決策、保存更正
收集工作流產出
保留來源中繼資料

檢索

RETRIEVAL — The operating layer

檢索是整張圖的核心操作層：在任務發生的當下提供對應脈絡、只取與任務相關的片段、避免脈絡膨脹、減少使用者重複解釋背景。

代理不需要知道全部，只需要那 6 個關鍵片段。RAG（檢索增強生成）的核心邏輯是：先查到正確資料，再根據證據作答，而不是依賴訓練記憶推測。

▸ 研究指出，良好的檢索接地可將幻覺率降低約 70–90%，因為答案被綁定在被檢索出的證據上。

此刻給出對的脈絡
任務專屬的記憶
只拉重要的、避免脈絡膨脹
減少人類重新解釋

⌁ 觀念釐清

RAG 是「依查詢即時檢索」，Memory 是「跨對話持久保存的狀態」。多數場景兩者並用。

真相來源

SOURCE TRUTH — Who wins on conflict

當兩份資料衝突時，哪一份優先？即時 CRM vs. 舊 SOP、通話逐字稿 vs. Slack 更正、公開可用 vs. 內部限定、歷史脈絡 vs. 當前紀錄，必須先定義來源階層（source hierarchy）。

核心原則：檢索負責縮小候選範圍，治理負責定義哪份資料有效。當過期草稿與正式政策同時可被檢索到，prompt 無法可靠判斷哪份才算數。

▸ 生成式 AI 約有 3–10% 的輸出是憑空捏造；在法務情境甚至可達 34%。導入治理化的脈絡層，可把幻覺率再砍超過 40%。

哪個來源說了算？
即時 CRM vs. 舊 SOP
逐字稿 vs. Slack 更正
歷史脈絡 vs. 當前真相

⚠ 陷阱

未定義來源階層時，代理在衝突的資料間無依據可循，輸出信心標示與準確度脫鉤。

權限

PERMISSIONS — The brain needs walls

誰能看到什麼？工作流層級的存取、客戶脈絡邊界、HR／財務封鎖、公開內容的安全標記，都需要明確定義。每個工作流只取得對應的脈絡範圍，而不是讓所有資料共用同一個存取層。

權限控制同時具備防幻覺效果：列級（row-level）、欄級（column-level）的存取控制將代理限制在既有權限模型內，來源範圍縮小後，後段驗證的成本也隨之降低。

誰能看到什麼
工作流層級存取
客戶脈絡邊界
HR／財務封鎖、公開內容安全

⚠ 陷阱

缺少存取控制的記憶系統，不同工作流、客戶、敏感度的資料會互相干擾，且難以稽核。

回饋迴路

FEEDBACK LOOPS — Corrections become rules

每一次更正都應沉澱為一條規則：語氣規則、來源優先級規則、CRM 風險規則、路由規則，讓重複出現的錯誤有機制防止再發。

依據多項研究，寫在 prompt 裡的自然語言規則只是建議，不構成約束。要讓更正生效，需將其轉為符號規則、schema 或驗證層，模型才無法繞過。

更正 → 變成規則
語氣／來源規則更新
CRM 風險規則更新
重複的錯誤逐漸消失

↻ 原則

每次更正沉澱為規則後，同類錯誤的再發機率下降，系統品質隨使用累積而提升。

執行

EXECUTION — Work gets done

前五階段到位後，執行端的效益直接體現：代理啟動時已有相關脈絡、報告產出內含來源標註、流程審查能識別風險、通話洞察可轉為可重用的 playbook、操作者不需重複提供背景資訊。

工作的完成方式改變：有脈絡支撐、有證據標註、來回次數減少。

代理一啟動就更聰明
內容自帶證據層
通話洞察變成 playbook
操作者不必從零開始

失效模型與可運作模型的對照

兩種模型的差異在於：資料來源是否整合、更正是否沉澱為規則。

BROKEN — 每次都從冷啟動開始

Prompt提示

→

Output輸出

→

Scattered Feedback四散的回饋

→

Lost Decision遺失的決策

→

Restart重新開始

WORKING — 下一次更好

Calls / CRM / SOP / Slack連起來的來源

→

Retrieval對的脈絡

→

Agent聰明啟動

→

Work產出物

→

Correction審查

→

Rule沉澱成規則

自動化前的六項審計問題

將工作流交給代理之前，用這份清單確認基礎架構是否到位。

這個工作流需要哪些來源？

先盤點，再決定要連什麼進來。

當來源衝突時，哪個贏？

這就是你的來源階層。

哪些脈絡是「永遠必備」？

每次都要載入的核心脈絡。

哪些脈絡「永遠不該用」？

權限與禁區，明確封鎖。

哪些更正會重複出現？

重複的更正最值得變成規則。

一次更正如何變成規則？

定義「更正 → 規則」的機制。

六條操作守則

RULE 1

擷取是儲存，不是智慧。

RULE 2

精準檢索的效果優於擴大記憶容量。

RULE 3

來源治理定義哪份資料有效，防止信心與準確度脫鉤。

RULE 4

權限控制限定代理的存取範圍，確保可稽核性。

RULE 5

每次更正應沉澱為符號規則或 schema，而非只更新 prompt。

RULE 6

系統品質應隨使用次數累積，而非每次重置。

累積型的操作效益

◷

更快的決策

帶著脈絡行動，而不是猜。

⇄

更乾淨的交接

少了重複解釋，更清晰。

★

更好的代理產出

相關、準確、有證據。

⤬

更少脈絡切換

維持心流，交付更快。

↻

更少重複更正

修一次，系統就記住。

↗

機構記憶持續累積

決策與更正形成可查詢的資產。

◎ 單一真相來源

▤ 決策被記錄

▽ 脈絡被策展

⊟ 存取被控制

↻ 回饋被複利

♛ 記憶是競爭優勢

社群實戰：來自 Reddit、HN 與工程圈的 tips 與踩雷紀錄

以下整理自 2026 年社群討論與實務文章（Hacker News、Reddit r/LocalLLaMA、r/LLMDevs、DEV、產業部落格），以自身語言重述要點。

TIP · 觀念

擴大 context window 無法解決脈絡腐爛問題

社群討論中的常見共識：輸入過多導致脈絡腐爛（context rot），準確度反而下降。建議先實作「只取 6 個關鍵片段」的檢索策略，再評估是否需要更大的視窗。

TIP · 架構

分清 RAG 與 Memory

RAG 像超強搜尋、不帶個人化；Memory 是跨對話可讀寫、會「累積經驗」。客服 FAQ 用 RAG，個人化助理需要 Memory，多數場景兩者並用。

PITFALL · 踩雷

來源治理缺位時，prompt 無法彌補

常見事故：草稿、舊政策、正式版本同時可被檢索，模型摘要出錯誤內容且信心標示為高。解決順序是先定義來源權威，再調整 prompt。

PITFALL · 踩雷

prompt 是建議，不是約束

把「最多 10 人」寫在 docstring 裡，代理照樣 book(15)。要用符號規則／schema 驗證／工具層強制，而不是寄望模型自律。

HACK · 實作

「無證據，不作答」：單一規則可防止整類錯誤

強制每個結論對應到被檢索的來源證據，無法對應時回覆「無可靠來源」。一條規則可阻擋大量高信心錯誤輸出。拒絕作答的代價低於輸出錯誤結論。

HACK · 實作

每個片段都附中繼資料：標題＋日期＋來源層級

chunk 入庫時就標好 metadata，檢索時才有辦法做來源階層裁決與信心標註，也讓答案可追溯、可稽核。

HACK · 進階

用多代理／Plan-Do-Check 互相挑錯

單一代理在孤立中幻覺、沒人抓得到。讓「執行者／懷疑者／裁決者」分工辯論，或用 Plan→Do→Check 的巢狀審查，在送到使用者之前先抓錯。

HACK · 成本

向量過濾工具選擇與脈絡壓縮

依據社群回報，以向量過濾只選取相關工具，token 用量可下降 80% 以上。配合摘要式壓縮，保留完成任務所需的最少 token。

USE CASE · 客服

歷史工單 + 文件即時回答

對過往工單與說明文件做向量檢索，當場給出準確答覆。Intercom 的 Fin、Atlassian Intelligence 都是這種 RAG 的正式上線案例。

USE CASE · 法務

先檢索最相關的 10 個判例再摘要

別把 200 頁法條整個倒給模型（又貴又慢又空泛）。先用向量搜尋取前 10 相關案例，逐一摘成結構化筆記再綜合。實務報告：準確度 +27%、成本 −40%。

USE CASE · 業務

通話洞察 → 可重用 playbook

把 Gong 通話逐字稿的異議與成交模式擷取出來，沉澱成業務 playbook，新人不必每次從零開始學。

USE CASE · 工程

給 Triage 代理一個長期記憶

用向量庫記住過去的 GitHub issue，新進 issue 自動比對、標出可能的重複，省下兩個工程師查同一個 bug 的浪費。

Prompt 設計範例：遵守來源階層的檢索代理

將六個階段濃縮為可直接套用的系統提示骨架。核心要素為：來源階層、權限邊界、無證據不作答、更正轉規則。

company-brain-retrieval-agent.system.md

# 角色
你是「公司大腦」檢索代理，服務於：{{工作流名稱}}。
你的任務是用已驗證的公司脈絡作答，而不是憑訓練記憶硬猜。

# 來源階層（衝突時，由高到低優先採用）
1. 即時系統真相          # 例：HubSpot 當前紀錄
2. 最新的領導層更正      # 被標記為 [RULE] 的內容
3. 現行 SOP / Playbook   # 注意版本日期，舊版不算數
4. 通話逐字稿 / Slack    # 僅作佐證，不可凌駕 1–3

# 權限邊界（硬規則，不可協商）
- 僅可使用標記為 [PUBLIC-SAFE] 或 [本工作流可見] 的內容。
- 嚴禁引用 [HR] / [FINANCE] / [INTERNAL-ONLY] 來源。
- 不同客戶的脈絡不可混用。

# 檢索原則
- 只取與當前任務最相關的 6 個片段，避免脈絡膨脹。
- 每個關鍵主張都要能對應到具體來源（標題 + 日期）。

# 輸出規則
- 無證據，不作答：若無可靠來源支持，回覆
  「目前沒有可靠來源，建議向 {{負責人}} 確認」。
- 對每個關鍵結論標註信心：高 / 中 / 低。
- 來源衝突時，明說「採用了哪一個、捨棄了哪一個、為什麼」。

# 回饋（讓更正變成規則）
- 若使用者更正你，將更正濃縮成一條可重用規則，
  輸出在 <new_rule> ... </new_rule> 標籤中，
  以便寫回規則庫，下次自動生效。

小提醒：上面的 {{變數}} 請替換成你實際的工作流、負責人與來源標籤。權限與來源階層最好同時用「系統層的存取控制」雙重把關，不要只靠這段文字。

30 天導入路線圖

選擇一個使用頻率高、失效點明確的工作流，先完整跑過六個階段一次，再擴展到其他工作流。

Week 1 · 擷取 & 盤點

選一個工作流，把來源連起來

用前面的審計 6 題，盤點這個工作流需要哪些來源。開始擷取：通話轉錄、決策紀錄、更正存檔，並為每個片段標好中繼資料（標題、日期、來源層級）。

Week 2 · 檢索 & 真相來源

建最小可用的 RAG，並寫下來源階層

把資料切塊、做嵌入、入向量庫。明確定義衝突時誰說了算。導入「只取 6 個關鍵片段」與「無證據不作答」。

Week 3 · 權限 & 護欄

加上存取控制與輸出驗證

用列級／欄級權限把代理關進既有權限模型；封鎖 HR／財務等禁區。對輸出加 schema 驗證與信心標註，讓「有自信的錯」無法溜出去。

Week 4 · 回饋 & 複利

讓更正變成規則，量測成效

建立「更正 → 規則」的機制（new_rule 寫回規則庫）。量測幻覺率、解決時間、來回次數的變化，再把這套模板複製到下一個工作流。

六階段總結

將零散的公司脈絡整合為 AI 代理可用的記憶系統，關鍵在於正確時刻、正確脈絡、正確權限的組合。擷取確保不遺漏，檢索提供對應片段，來源治理定義有效資料，權限控制範圍，回饋迴路讓更正沉澱為規則，執行端產出帶有來源標註的結果。記憶是原料，檢索是操作層；機構記憶隨使用累積，形成可查詢的知識資產。