實戰手冊 · Field Manual 2026 春季號 · 第 03 期

github.com/inference-sh/skills · 437 ★

第 03 期 · 開源工程 / Agentic Toolbelt

belt CLI
整合 250+
AI 模型。

inference-sh/skills 將 FLUX、Veo、Sora、Runway、Claude、Gemini、Tavily、Exa、X / Twitter API 封裝為 Claude Skills。一條 /plugin install 裝完，agent 即可呼叫圖像生成、影片合成、LLM 推論、網路搜尋及社群自動化，無需分別申請各家 API key 或學習各家 SDK。

437

GitHub Stars

250+

支援模型

大工具類別

MIT

永久免費授權

套件簡介

agent 的統一介面：五大工具類別，單一帳號。

inference-sh/skills 將圖像、影片、LLM、搜尋、Twitter 五類服務封裝為 Claude Skills，底層透過 belt CLI 統一呼叫。inference-sh/skills 把各家 SDK 與 API key 的差異收進 belt，agent 拿到的是一份標準化的能力清單，而非分散的服務端點。

目錄結構分四層：tools/ 五大類能力（圖、影片、LLM、搜尋、Twitter）、sdk/ JS 與 Python 兩種接法、ui/ 可嵌入網頁 agent 的元件、guides/ 內容工作流範本（文案、設計、影片腳本、社群）。inference.sh 負責後端 250+ 模型的供應，執行 belt login 取得帳號權限後，即可呼叫 FLUX 出圖、Veo 出影片、Tavily 搜尋新聞、Claude 或 Gemini 跑文字任務。

設計重點在 plugin 化：一條 /plugin install inference-sh 裝完，Claude Code 在對話中偵測到「畫一張」「找新聞」「發推文」等意圖時，會自動路由至對應 skill。使用者下達意圖，工具選擇由 agent 處理。

inference-sh skills · 工作流

belt login→ /plugin install→ Agent 解析意圖→ 挑對應 Skill→ 呼叫模型→ 取回結果

AI agent skills for 250+ models via inference.sh CLI.
Generate images, videos, call LLMs, search the web, and more.

— inference-sh/skills README

三種裝法

三種路徑將整套能力包裝進 Claude Code。

環境只要 Claude Code 加上 inference.sh 的 CLI belt。先到 inference.sh 註冊帳號、跑 belt login 拿到 API 權限,再選一種裝法:整套裝、單一技能裝、或手動 cp 進 skills 目錄。

# 在 Claude Code 對話裡輸入(三選一,/plugin install 是最快路徑)
/plugin marketplace add inference-sh/skills
/plugin install inference-sh@inference-sh-skills
/plugin install inference-sh
      

只要單一技能?

不想把整個 marketplace 都拉進來,可以用 npx skills add 指定 @<name> 只裝一個。例如做設計只需要 FLUX 出圖、做行銷只需要 Twitter 自動化,各裝各的:

# 整套
npx skills add inference-sh/skills
# 或只裝你要的
npx skills add inference-sh/skills@flux-image
npx skills add inference-sh/skills@google-veo
npx skills add inference-sh/skills@llm-models
npx skills add inference-sh/skills@web-search
      

belt CLI 一次登入

所有 skill 背後都呼叫 inference.sh 的 belt。第一次裝完先 login，確認 app 清單能撈出來。撈得到即代表帳號與權限已接上，後續由 agent 接管。

belt login
belt app list
      

不需要各自的 API key。安裝後無需分別申請 OpenAI、Google、Anthropic、Tavily、X 的 key。belt 以 inference.sh 統一帳號管理 250+ 模型的存取權，所有計費與用量集中在單一地方。這是本 repo 與其他彙整倉庫的主要差別。

五大工具 · 兩種 SDK · 三套 UI

repo 四層結構：tools、sdk、ui、guides 各層的代表入口。

整個 repo 拆成四層:tools/ 是 agent 直接呼叫的能力、sdk/ 給開發者寫程式接、ui/ 給 web app 嵌入、guides/ 是內容工作流範本。下面 12 張卡片把四層的代表性入口列出來。

Tool · 01

ai-image-generation

圖像生成主管

50+ 模型,包括 FLUX、Gemini、Revé。agent 講「畫一張」就會路由進來,可指定風格、長寬比、批次量。

Tool · 02

ai-video-generation

影片生成主管

40+ 模型,Veo、Sora、Runway、WAN 收在同一介面。短片、產品宣傳片、社群短片場景全包。

Tool · 03

llm-models

LLM 路由

Claude、Gemini、Kimi、GLM 走同一個 skill。讓 agent 能做 cross-model A/B、second opinion,不必綁死一家。

Tool · 04

web-search

即時情報員

Tavily 與 Exa 雙搜尋引擎,適合做研究、找新聞、補上 LLM 訓練資料截止後的事實。

Tool · 05

twitter-automation

社群手腳

X / Twitter API 整合,agent 能讀串、發文、抓帳號活動。行銷自動化的最後一哩。

SDK · 06

javascript-sdk

TS 與 React

JavaScript / TypeScript SDK,支援 streaming 與 React 元件直接渲染。做 chatbot 與 dashboard 必備。

SDK · 07

python-sdk

Python 非同步

async 與 streaming 都覆蓋,適合做後端 worker、爬蟲管線、批次任務。資料管線首選。

UI · 08

agent-ui

完整 Agent 介面

整套可嵌入的 agent 對話介面,包含工具呼叫狀態、結果渲染、串流動畫。自家 app 抄完就能跑。

UI · 09

chat-ui

對話元件

比 agent-ui 更輕,只給你 chat 部分。需要客製外觀、自己控制 layout 時用。

UI · 10

tools-ui

工具卡渲染

專做 tool call 與 result 卡片的視覺化,把 agent 跑了哪些 skill、回了什麼,漂亮地秀給用戶。

Guide · 11

guides/prompting

Prompt 範本庫

Prompt Engineering 與影片提詞範本。社群試出來的好招直接寫成 SKILL.md 收進專案。

Guide · 12

guides/design+social

內容工作流

Landing page、Thumbnail、Logo、Storyboard、LinkedIn 文、Twitter 串、Carousel 全套範本,行銷與設計團隊直接套用。

你想做什麼,用哪一條?

場景	該裝的 skill / 模組	主要呼叫
出圖 · 視覺素材	`@flux-image` · `ai-image-generation`	FLUX、Gemini、Revé
出影片 · 短片	`@google-veo` · `ai-video-generation`	Veo、Sora、Runway、WAN
多模型比稿 · second opinion	`@llm-models`	Claude、Gemini、Kimi、GLM
研究 · 補事實	`@web-search`	Tavily、Exa
社群排程 · 發推	`twitter-automation`	X / Twitter API
自家 web app 嵌入 agent	`javascript-sdk` + `agent-ui`	React stream + tool cards
後端批次任務	`python-sdk`	async 呼叫 belt

進階用法 · POWER PATTERNS

六個配置模式提升 agent 出貨效率。

以下六條均從 README 與 repo 目錄結構推導，是安裝後容易被忽略、但對 agent 出貨效率影響明顯的配置細節。所有指令路徑均對應 README 原文。

TIP 01

用 marketplace add 走 plugin 路線

/plugin marketplace add inference-sh/skills 一次掛上整個 marketplace,後續 inference.sh 新增 skill 不用重灌,重啟 Claude Code 就會看到新功能。長期維護成本最低。

來源 · README · Plugin install

TIP 02

單一 skill 走 npx 更輕

不需要 250+ 模型全部？npx skills add inference-sh/skills@flux-image 只裝 FLUX 出圖，Skill 體積最小，agent 上下文也最精簡。上下文越短，模型挑工具越準確。

來源 · README · npx skills add

TIP 03

guides/ 的用途：作為 prompt 範本，而非說明文件

guides/prompting、design、video、social 均已寫成 SKILL.md 結構。agent 偵測到「我要寫 LinkedIn 文」時會自動套用 social guide 的 voice 與結構。使用時應將其視為 prompt 範本，而非說明文件。

來源 · repo · guides/ 目錄

TIP 04

llm-models 跑 cross-model A/B

同一段 prompt 分別送 Claude 與 Gemini 各跑一次，讓 agent 對齊輸出。相較於單一模型，輸出一致性較高，在中文內容與長篇結構化文案上差異尤為明顯。

來源 · README · llm-models tool

TIP 05

SDK 與 plugin 不互斥

Claude Code 裡用 plugin 路線跑互動,後端自家 worker 直接走 python-sdk 呼叫 belt 同一帳號。兩條路同個 inference.sh 帳號計費,你的內容生產線變一站式。

來源 · repo · sdk/ 目錄

TIP 06

agent-ui 直接打包 chatbot

將 ui/agent-ui 與 sdk/javascript-sdk 接起來，加上 tools-ui 顯示工具狀態，約 15 分鐘即可組出可運行的自家 agent。工具呼叫與結果自動渲染，含 streaming 動畫。

來源 · repo · ui/ + sdk/

實際走一輪

以製作社群短片為例：五條 skill 接力完成研究至發文。

以下示範製作一支 60 秒 SaaS 產品短片並搭配 X 串文。環境條件：已完成 belt login，Claude Code 裝有 inference-sh skills。輸入一句意圖，五個 skill 依序執行，全程無需手動切換 SDK 或 API key。

~/projects/saas-promo · claude code · inference-sh skills

You › 幫我做一支介紹我家 SaaS 的 60 秒短片,中文旁白配 X 串文

[claude code] 解析意圖 → 需要 5 個 skill 接力 · web-search:找 2026 競品的短片風格 · llm-models:寫 60 秒腳本與旁白 · ai-image-generation:出 storyboard frame · ai-video-generation:合成短片 · twitter-automation:排程 X 串文

[1/5 · web-search · Tavily] 查「中文 SaaS 短片 2026 範例」 → 抓 6 篇 → Claude 萃取共性:節奏快、文字覆蓋層、單一賣點

[2/5 · llm-models · Claude] 產出 60 秒腳本 · 6 個 shot · 旁白逐字稿 → cross-check 給 Gemini 跑一輪,修字詞節奏

[3/5 · ai-image-generation · FLUX] 生 6 張 storyboard frame · 1408×768 中文標題覆蓋層 · CJK 安全留白

[4/5 · ai-video-generation · Veo] 以 6 張 storyboard 為 reference 合成 60 秒 → /Downloads/saas-2026-promo.mp4

[5/5 · twitter-automation] 產 3 則 X 串文 · 排程 09:00 / 12:00 / 18:00 → 排隊 ID xxxxxxx · 可手動驗收後送出

完成 · 5 條 skill 接力 · 共耗時 14 分 [單一 belt 帳號結帳,沒有任何外部 API key]

五條 skill 接力，從研究、文案、storyboard、影片合成到社群排程，單一對話完成。

— inference-sh/skills 核心使用場景

這條流程值得拆解的點

一個帳號管理 250+ 模型存取。agent 不用切換 SDK 與 API key,失敗率與整合成本同步壓低。對小團隊來說最大的省事在「不用再為每個服務報帳」。

guides/ 在背景影響 prompt。即使你沒明說「寫得有節奏」,llm-models 跑 LinkedIn 或 X 文時會自動帶上 guides/social 的範本。voice 一致性是被 guides 而非 prompt 推動的。

skill 可任意替換。storyboard 可改用 Gemini 出、影片可改用 Runway 合成、推文可改為人工撰寫。關掉對應 skill 即可，流程不綁定單一供應商。

使用前注意

已知限制與部署前須確認的事項。

需要 inference.sh 帳號加 belt CLI。belt 需連接 inference.sh 後端，離線環境無法運行。須先至 inference.sh 完成帳號註冊方可開始使用。
模型可用性會隨上游政策變。250+ 模型清單由 inference.sh 後端維護。Sora、Veo 之類新模型可能因供應商限制突然調整配額,production workflow 不要綁死單一模型,要保留替代品。
Twitter / X 自動化遵守平台政策。twitter-automation 走 X API,免費層級每月有貼文與讀取量上限。大量自動發文之前先看你的 X 帳戶等級,以及最新的自動化政策。
影片合成成本明顯。ai-video-generation 呼叫的是上游影片模型,每段 5–60 秒成本可能是純文字生成的數十倍。先在 dev 環境用低解析度跑通流程再上量。
guides/ 提供引導，不強制執行。prompt 與內容範本是給 agent 的建議引導，agent 不一定照走。若需鎖定固定對外語氣，須在 CLAUDE.md 另行撰寫 voice 規則。
UI 元件假設你用 React。agent-ui、chat-ui、tools-ui 都是 React。原生 app 或非 web 場景需要自己重寫,SDK 反而比較好遷移。
不要把 belt token 提到 commit。belt 認證與 API key 雖然集中管理,但本機 config 還是要當作敏感資料,不要 push 到 public repo。.gitignore 先確認過再開始用。
Plugin 與 npx 兩條路線別混裝。同一台機器混裝兩種路徑容易出現「兩份 skill」相互覆蓋,出問題時很難追。選一種裝法,團隊內統一。

進階路徑

將四層結構接進現有工作流的五種方式。

tools / sdk / ui / guides 四層完全解耦。任意一層可單獨使用，其餘三層可替換或省略，因此可漸進式接入現有工作流，無需整套遷移。

進階玩法地圖

1. fork tools/ 加新供應商。inference.sh 還沒接的小模型(例如自家 fine-tune),仿照 tools/ai-image-generation 的 SKILL.md 結構加一個資料夾,丟回 marketplace 就能讓所有 agent 用。

2. 把 sdk/ 接進自家後端。python-sdk 的 async + streaming 讓你能把 inference.sh 變成內部「AI Gateway」,團隊所有腳本一律走同一條,計費與用量集中監控。

3. 換掉 guides/ 變成你的 brand voice。guides/social、guides/writing 是 SKILL.md,可以複製一份改成公司語氣,picker 會優先讀你公司版本。一份檔案管全公司語氣。

4. 接 agent-ui 做客戶 demo。ui/agent-ui + sdk/javascript-sdk 串起來就是一個能 demo 工具呼叫的 chatbot,給銷售拿去 demo 給客戶最直接。

5. 把 belt 包進 CI。belt 為純命令列工具，可在 GitHub Actions 與內部 CI 執行批次任務，例如每週自動生成報表縮圖、thumbnail、研究摘要，無需人工介入。

最該讀的三份延伸閱讀

① cli-install.md：belt CLI 完整安裝與權限設定流程。
② inference.sh/docs：belt 全部指令、帳號管理、計費機制，及 250+ 模型最新清單。
③ CONTRIBUTING.md：新增 tool、SDK、guide 的 PR 流程，及命名與 SKILL.md 撰寫規範。

inference-sh/skills 將研究、文案、視覺、影片、社群五條工作流收進同一個 belt 帳號，統一計費與存取管理。

— inference-sh/skills 設計目標