Skills Atlas · dothething 使用說明書
Repo Deep-Dive · fluffypony / dothething

Skills Atlas — Repo 使用說明書 以自然語言描述目標,dothething 自動規劃並執行。 本地自走型 AI Agent,底層為 Claude Opus 4.6 與 45+ 工具。

dothething(DTT)是一個以單支 Bash 腳本啟動的本地 AI 代理:輸入一句自然語言目標,它自行規劃步驟、上網搜尋、操作瀏覽器、讀寫檔案、執行命令,完成後回傳結果,卡住時請求人工輸入。本份說明書涵蓋功能總覽、安裝設定、實戰工作流與進階用法。

GitHub Stars
1.6k
由 Riccardo Spagni(fluffypony)維護,前 Monero 核心維運者。
主腦模型
Opus 4.6
經 OpenRouter 路由,搭配 Sonnet 4.6 與 GPT-5.4 oracle 分工。
內建工具
45+ Tools
檔案、Shell、瀏覽器、視覺、Email、剪貼簿、MCP、自訂 skills。
授權與平台
BSD-3
macOS / Linux + Python 3.11+,1.6k Stars,BSD 3-Clause 開源。
01 / 編者手記 FROM THE EDITOR · WHY DOTHETHING MATTERS

本地自走代理:接收目標後自行規劃與執行,完成或回報卡點。

編者手記 EDITOR'S NOTE

dothething 是一個自走代理框架:輸入一句自然語言目標,它會自行規劃步驟、開瀏覽器、讀寫檔案、發送 Email,遇到需要決策的節點時主動請求人工輸入,直到任務完成或預算耗盡。底層為 Claude Opus 4.6,透過 OpenRouter 路由。

01

本地執行,資料不離開自己的機器。

整個代理跑在你自己的機器上,瀏覽器走 Camoufox(Firefox 反指紋分支),搜尋走本地 SearXNG,狀態存在 ~/.dtt/。你的 API key、cookies、剪貼簿與郵件,全程沒有第三方 dashboard,只有 OpenRouter 那一條對外連線。

02

三層模型分工:主腦 / 摘要 / oracle 各司其職。

主腦是 Claude Opus 4.6 負責決策;摘要、Notte 解析、delegate 子任務交給較便宜的 Sonnet 4.6;遇到難題還可呼叫 GPT-5.4 當 oracle 二意見。Anthropic block-level prompt caching 與 OpenRouter sticky routing,把長任務的 input 成本壓到一個合理值。

03

能擴充、能編排、能省錢。

支援自訂 ~/.dtt/skills/(沿用 Claude Code 的 SKILL.md 慣例)與 ~/.dtt/mcp.json 連接外部 MCP 伺服器;--orchestrator 可同時跑多達 16 個並行代理;--max-cost 在預算到頂時自動 checkpoint,下次 --resume 接著做,適合嵌入正式工作流。

02 / 功能總覽 FEATURES · 45+ TOOLS · MULTI-MODEL
01

功能 總覽

dothething 是代理框架,把規劃、瀏覽器、檔案、Email、剪貼簿、MCP 整合進單一自走迴圈,提供 45+ 工具供模型按需呼叫。

5 Entries
Plan · Browse · Edit · Email
Multi-Model Routing
01/05
fluffypony / dothething

會自己規劃並追蹤進度的代理迴圈

只需描述目標,模型自行決定每一回合要呼叫哪個工具

主迴圈每一輪由 Claude Opus 4.6 決定下一個動作:可呼叫 plan_createplan_updatenotes_addthinkoracledelegate。預設 200 個 turn 上限(--max-loops 可調),每一步都會更新計畫並把要點寫進 notes,避免長任務遺忘上下文。卡關或需要決策時會主動呼叫 request_user_input,而非亂猜。

✓ 自走迴圈 plan / notes / think oracle 二意見 delegate 分工
Main Model Opus 4.6 Default Loops 200 Tools 45+
02
fluffypony / dothething · web 工具集

本地 SearXNG +Notte / Camoufox 瀏覽

搜尋與瀏覽都跑在你機器上,不送雲端

search_web 走本地 SearXNG 實例,整合 Google、Bing、DuckDuckGo 與圖像搜尋;fetch_pageNotte 解析靜態頁面;browser_agent 透過 Camoufox(反指紋 Firefox 分支)跑互動式抓取與多步流程。可選 --headed 開視窗 debug,SERPER_API_KEY 啟用 Serper 補強,TWOCAPTCHA_API_KEY 自動解 captcha。

SearXNG Notte Camoufox 2Captcha 可選
Search SearXNG Browser Camoufox
03
fluffypony / dothething · file & shell

完整的檔案與 Shell 工具軸

read / write / edit / batch / diff 與持久 shell session

檔案層提供 read_filewrite_fileedit_filebatch_readdiff_files;系統層有 run_commandshell_session(保留環境變數與 cwd)、run_codegloblist_dirsearch_filehttp_request。視覺工具 analyze_imageanalyze_data 處理截圖、CSV、JSON。預設 cwd 是當前目錄,--cwd 可改。

batch_read shell_session analyze_image
File Ops 5 Tools Shell Persistent
04
fluffypony / dothething · AgentMail

代理擁有自己的信箱

收信、發信、等回覆都是工具呼叫

透過 AgentMail 整合,提供 email_create_inboxemail_sendemail_listemail_reademail_wait_for_messageemail_wait_for_message 可暫停代理執行,等到符合條件(寄件人 / 主旨 / thread)的郵件抵達再續跑,適用於 OTP 驗證、客戶確認、註冊流程等非同步場景。

AgentMail OTP 等候 自有 inbox
Provider AgentMail Tools 8 Email
05
fluffypony / dothething · skills & MCP

沿用 Claude Code 慣例的擴充層

~/.dtt/skills/ 與 ~/.dtt/mcp.json 都認得

自訂技能放在 ~/.dtt/skills/<name>/SKILL.md,frontmatter 支援 inline: true(注入系統提示)、allowed-tools(限縮工具集)、disable-model-invocation(隱藏自動觸發)。MCP 伺服器寫在 ~/.dtt/mcp.json,代理會自動發現所有暴露的工具。剪貼簿與 request_user_input 也都是工具,模型隨時能來找你。

Claude Code 相容 MCP 自動發現 剪貼簿支援
Skills Dir ~/.dtt/skills/ MCP Config mcp.json
03 / 安裝與設定 CLONE · API KEYS · ENV · SKILLS · MCP
02

安裝與 設定

五個步驟涵蓋 git clone、API key 設定、模型路由、自訂 skills 與 MCP 接入,完成後即可執行第一條 prompt。

5 Entries
macOS / Linux · Python 3.11+
OpenRouter Required
01/05
fluffypony / dothething · 一條指令安裝

git clone,然後直接 ./dtt.sh

沒有套件管理、沒有 Docker、沒有設定檔精靈

git clone https://github.com/fluffypony/dothething.gitcd dothething./dtt.sh --prompt "your task here"。首次執行會在 /tmp/dothething/ 自動建立 venv、下載 SearXNG 與 Camoufox,並提示輸入 OpenRouter API Key(必填)與 2Captcha Key(選填),存到 ~/.dtt/env(mode 0600)。需求只有 macOS 或 Linux 加 Python 3.11+。

✓ 一條 bash 啟動 Python 3.11+ macOS / Linux venv 自動建立
Entry ./dtt.sh Runtime /tmp/dothething/ Config ~/.dtt/env
02
fluffypony / dothething · 環境變數

六支金鑰,只有一支必填

~/.dtt/env 統一保存,shell 變數可覆寫

必填 OPENROUTER_API_KEY。選填:SERPER_API_KEY(補強搜尋)、TWOCAPTCHA_API_KEY(自動解 captcha)、AGENTMAIL_API_KEYAGENTMAIL_INBOX_IDAGENTMAIL_HUMAN_EMAIL(OTP 轉發)。檔案 ~/.dtt/env 以 0600 權限存放,shell export 會即時覆寫保存值,CI 環境下換 key 不必改檔。

OpenRouter 必填 0600 權限 shell 可覆寫
Required 1 Key Optional 5 Keys
03
fluffypony / dothething · 模型路由

三層分工的模型架構

主腦 / 摘要 / oracle 各司其職

預設主腦 Claude Opus 4.6--fast 改用 Opus 4.6-fast(便宜但能力較弱)。Summarizer / Notte 解析 / delegate 子任務固定走 Sonnet 4.6。Oracle 預設 GPT-5.4--oraclepro 升級為 GPT-5.4-pro 處理深度疑難。模型呼叫全程經 OpenRouter,可在 dashboard 追蹤 token 與成本。

Opus 4.6 主腦 Sonnet 4.6 摘要 GPT-5.4 oracle
Main Opus 4.6 Helper Sonnet 4.6
04
fluffypony / dothething · 自訂 skills

沿用 Claude Code 的SKILL.md 慣例

把你公司的 SOP 變成可呼叫的工具

技能放在 ~/.dtt/skills/<name>/SKILL.md,子目錄可任意組織。Frontmatter 支援:namedescriptioninline: true(注入系統提示)、allowed-tools: [Read, Write](含 allowed-tools 等同 inline)、disable-model-invocation: true(從自動清單隱藏)。Inline 技能直接成為 prompt 一部分;非 inline 技能由 use_skill 以隔離任務形式呼叫。

SKILL.md inline / use_skill allowed-tools
Path ~/.dtt/skills/ Format SKILL.md
05
fluffypony / dothething · MCP 配置

~/.dtt/mcp.json 即接即用

代理會自動發現所有 MCP 暴露的工具

設定檔結構標準:{ "mcpServers": { "<name>": { "command": "npx", "args": [...], "env": { "API_KEY": "${ENV_VAR}" } } } }。符合 MCP 規範的伺服器均可接入,包括 Notion、Slack、Linear、Postgres、Playwright 等。代理啟動時自動列舉伺服器、載入工具描述,併入主清單供模型決策。

標準 MCP 規範 自動工具發現 env 變數展開
Config mcp.json Discovery Auto
04 / 實戰應用 RESEARCH · DATA · BROWSER · EMAIL · ORCHESTRATOR
03

實戰 應用

五個依官方文件與 Tenten 實測確認可行的情境,涵蓋研究報告、管線自動化、瀏覽器抓取、郵件等候與並行 orchestrator。

5 Entries
Long-Run · Pipe · Parallel
Real-World Tested
01/05
fluffypony / dothething · 深度研究報告

單一 prompt 生成多來源研究報告

適用於分析師、策略顧問、投資人的資料蒐集任務

./dtt.sh --prompt "Find 10 largest public companies by revenue that went bankrupt in last 20 years"。代理會自己擬計畫、跑 SearXNG + Notte 蒐集來源、把結果交叉驗證,必要時呼叫 oracle 釐清歧異,最後整理成 Markdown 報告寫進當前目錄。中途按任意鍵可即時下達追加指示,Ctrl-Q 把指示排到當步結束後再執行。

✓ 自走研究 即時插話 交叉驗證 Markdown 輸出
Inputs 1 Prompt Output Markdown Live Input Yes
02
fluffypony / dothething · pipe 模式

--pipe 模式:stdout 輸出,可嵌入 shell / CI

--pipe 只輸出最終結果,可串 pbcopy / jq / 後端 API

./dtt.sh --pipe --prompt "Summarize the README" | pbcopy 直接把摘要丟進剪貼簿。--pipe 抑制所有 log,stdout 只有最終報告;exit code 0 完成、2 部分完成、1 失敗。可在 cron、shell script、CI step 直接呼叫,把代理嵌進既有自動化流程而非另起一個 SaaS。

Unix-friendly 明確 exit code CI 嵌入
Flag --pipe Output stdout-only
03
fluffypony / dothething · 瀏覽器抓取

含 captcha 的瀏覽器抓取

Notte + Camoufox + 2Captcha 全程自動

browser_agent 處理需要點擊、表單、登入、驗證碼的多步流程;fetch_page 用 Notte 解析靜態頁面節省 token;http_request 直接打 API。設定 TWOCAPTCHA_API_KEY 後遇到 reCAPTCHA / hCaptcha 會自動轉送解碼。--headed 可顯示視窗用於 debug,但平常無頭執行更省資源。

multi-step 互動 2Captcha 整合 --headed debug
Engine Camoufox Captcha 2Captcha
04
fluffypony / dothething · 郵件等候

代理會耐心等回信

注冊、OTP、客戶確認都能自動完成

設好 AGENTMAIL_API_KEYAGENTMAIL_INBOX_ID,代理即擁有獨立收信地址。任務需要驗證碼或等待回覆時,email_send 寄出後,email_wait_for_message 暫停執行,直到符合條件(寄件人、主旨、thread)的郵件抵達。AGENTMAIL_HUMAN_EMAIL 可將需人工驗證的信件轉到指定信箱。

OTP 全自動 寄件人篩選 人機分流
Provider AgentMail Mode Wait + Filter
05
fluffypony / dothething · Orchestrator

最多 16 個代理同時開工

--orchestrator 開出 Textual TUI,逐行追蹤狀態

./dtt.sh --orchestrator 啟動全螢幕終端機介面,每個 agent 一行顯示狀態、phase、耗時、累積成本,可即時展開查看 log。內建 smart launcher 會在開工前估算成本,預設上限 16 個並行 agent。適合 N 家公司同時做 prospect research、N 個競品同時拆解、N 個語系同時翻譯落地頁。

Textual TUI smart launcher 最多 16 並行
Flag --orchestrator Max Agents 16
05 / 進階用法 POWER-USER PATTERNS · CLI · COST · RESUME

五個控制成本、維持穩定的 CLI 旗標與用法

以下旗標與用法均直接出自官方 README,適合在完成首次執行後用於長期穩定使用。

01
fluffypony / dothething · 預算守則

--max-cost 設預算上限

花到指定金額會自動 checkpoint,下次接著做

./dtt.sh --prompt "..." --max-cost 5.00 在累計花費達到 5 美元時暫停。下回 ./dtt.sh --resume <thread-id> --max-cost 10.00 接著跑,避免長任務失控。配合 --max-loops 可同時設輪數上限。

--max-cost --max-loops checkpoint 續跑
Flag --max-cost
02
fluffypony / dothething · 續跑 thread

--resume中斷變成分段

所有 thread 都存在 ~/.dtt/threads/,含每 thread cache

任何被 --max-costCtrl-C、或 OS 重啟打斷的工作,都可以 ./dtt.sh --resume <id> 接著做。~/.dtt/threads/<id>/cache/ 是 per-thread scratch 目錄,所有日誌會自動 redact API key 與 token,再寫入磁碟。

--resume ID 自動 redact per-thread cache
Path ~/.dtt/threads/
03
fluffypony / dothething · 即時插話

執行中按任意鍵,即時注入補充指令

Ctrl-Q 可把指令排到當前步驟結束後再進場

代理跑迴圈時,鍵盤敲下任何按鍵都會打開輸入框,把你的補充指示注入下一輪 prompt。若不想打斷當下的工具呼叫,按 Ctrl-Q 把訊息排隊,等該步完成才注入。比起重啟一次 prompt,這對長任務的引導效率高得多。

live input Ctrl-Q 排隊 無需重啟
Hotkey Any · Ctrl-Q
04
fluffypony / dothething · 模型開關

--fast 省錢、--oraclepro 攻難題

兩個旗標調整模型路由,不必改任何設定檔

日常任務可用 --fast 切換至 Opus 4.6-fast 降低費用;推理困難時加 --oraclepro,將 oracle 從 GPT-5.4 升級為 GPT-5.4-pro 取得第二意見。兩者可同時使用:主腦走 fast,oracle 走 pro,兼顧成本與決策品質。

--fast --oraclepro 混合策略
Cheap Opus 4.6-fast Smart GPT-5.4-pro
05
fluffypony / dothething · debug & notify

完成時自動通知你

--notify-desktop / --notify-email / --debug 三件套

長時間任務執行期間無需持續監控。--notify-desktop 完成時發出系統通知;--notify-email <addr> 透過 AgentMail 寄信,可由行動裝置接收。除錯時加 --verbose 取得完整 traceback、--debug 查看原始 API payload 與 cache 命中率,用於定位 prompt 結構問題。

--notify-desktop --notify-email --debug 看 cache
Notify Desktop · Email
06 / 行動方案 FROM THE TENTEN CMO OFFICE — DEPLOY DOTHETHING TODAY

將 dothething 接入現有工作流的四個起點

以下四個場景涵蓋分析、業務、工程與產品角色,均基於官方文件與 Tenten 部署經驗,clone 後可直接套用。

01 · 分析師 · Research

由代理執行多來源研究,人工負責判斷

固定工作流:./dtt.sh --prompt "..." --max-cost 3.00 --notify-email you@x.com。代理透過 SearXNG + Notte 抓取來源、呼叫 oracle 交叉驗證,預算達上限後自動 checkpoint。可同時啟動多個 thread 平行處理不同題目,人工介入集中在判斷而非蒐集。

02 · 業務 · GTM Pipeline

Orchestrator 一次拆解 16 家 prospect

./dtt.sh --orchestrator 開啟 TUI,輸入目標公司清單,每家配一個 agent 做 ICP 拆解、痛點整理、冷信草稿。配合 AgentMail 直接寄出第一封信,email_wait_for_message 等待回覆後自動執行後續步驟,將 prospect 開發流程中的資料收集環節自動化。

03 · 工程 · CI / CD

--pipe 嵌入 GitHub Actions 或 cron

./dtt.sh --pipe --prompt "..." --max-cost 1.00 在 GitHub Actions 或 cron 裡執行;exit code 0 / 2 / 1 對應完成 / 部分 / 失敗。可用於每日競品監控、文件生成、release notes 草稿,輸出透過 jq、Slack webhook、Notion API 串接後續步驟,直接整合進現有工程管線。

04 · 產品 · Skills + MCP

以 SKILL.md 將公司 SOP 納入代理工具集

~/.dtt/skills/ 寫入客服 SOP、品牌語氣、合約範本;在 ~/.dtt/mcp.json 接上 Notion、Linear、Postgres。代理啟動時自動載入,所有 thread 共用同一份設定。團隊 know-how 以文字形式存放於可版本控管、可 PR review 的 repo 中。

想把 dothething 接進你的營運?

代理已經開源。
接上你的 SOP 與 pipeline
是 Tenten 在做的事。

Tenten 是 AI-First 設計與技術顧問公司。我們把 Claude、MCP、Agentic Workflow 接進 Headless CMS、Webflow、Shopify Plus 的企業級交付 — 讓 dothething 這類本地代理,真正跑在你正式上線的研究、業務、與內容流程裡。

Tenten 如何部署 dothething 與類代理
Skills 架構諮詢
依團隊與堆疊選出適配 skills,建立 OpenClaw 路由與 CI/CD 部署流程。
Claude Design System Sprint
兩週固定價格,接上 frontend-design + brand-guidelines 到 production。
Agentic Commerce Build
Shopify Plus / Webflow / Headless 遷移,搭配 Claude + MCP 營運層。