實戰手冊 · Field Manual 2026 春季號 · 第 03 期
github.com/inference-sh/skills · 437 ★
b
第 03 期 · 開源工程 / Agentic Toolbelt

belt CLI
整合 250+
AI 模型。

inference-sh/skills 將 FLUX、Veo、Sora、Runway、Claude、Gemini、Tavily、Exa、X / Twitter API 封裝為 Claude Skills。一條 /plugin install 裝完,agent 即可呼叫圖像生成、影片合成、LLM 推論、網路搜尋及社群自動化,無需分別申請各家 API key 或學習各家 SDK。

437
GitHub Stars
250+
支援模型
5
大工具類別
MIT
永久免費授權
01
套件簡介

agent 的統一介面:五大工具類別,單一帳號。

inference-sh/skills 將圖像、影片、LLM、搜尋、Twitter 五類服務封裝為 Claude Skills,底層透過 belt CLI 統一呼叫。inference-sh/skills 把各家 SDK 與 API key 的差異收進 belt,agent 拿到的是一份標準化的能力清單,而非分散的服務端點。

目錄結構分四層:tools/ 五大類能力(圖、影片、LLM、搜尋、Twitter)、sdk/ JS 與 Python 兩種接法、ui/ 可嵌入網頁 agent 的元件、guides/ 內容工作流範本(文案、設計、影片腳本、社群)。inference.sh 負責後端 250+ 模型的供應,執行 belt login 取得帳號權限後,即可呼叫 FLUX 出圖、Veo 出影片、Tavily 搜尋新聞、Claude 或 Gemini 跑文字任務。

設計重點在 plugin 化:一條 /plugin install inference-sh 裝完,Claude Code 在對話中偵測到「畫一張」「找新聞」「發推文」等意圖時,會自動路由至對應 skill。使用者下達意圖,工具選擇由 agent 處理。

inference-sh skills · 工作流
belt login /plugin install Agent 解析意圖 挑對應 Skill 呼叫模型 取回結果
AI agent skills for 250+ models via inference.sh CLI.
Generate images, videos, call LLMs, search the web, and more.
— inference-sh/skills README
02
三種裝法

三種路徑將整套能力包裝進 Claude Code。

環境只要 Claude Code 加上 inference.sh 的 CLI belt。先到 inference.sh 註冊帳號、跑 belt login 拿到 API 權限,再選一種裝法:整套裝、單一技能裝、或手動 cp 進 skills 目錄。

# 在 Claude Code 對話裡輸入(三選一,/plugin install 是最快路徑) /plugin marketplace add inference-sh/skills /plugin install inference-sh@inference-sh-skills /plugin install inference-sh

只要單一技能?

不想把整個 marketplace 都拉進來,可以用 npx skills add 指定 @<name> 只裝一個。例如做設計只需要 FLUX 出圖、做行銷只需要 Twitter 自動化,各裝各的:

# 整套 npx skills add inference-sh/skills # 或只裝你要的 npx skills add inference-sh/skills@flux-image npx skills add inference-sh/skills@google-veo npx skills add inference-sh/skills@llm-models npx skills add inference-sh/skills@web-search

belt CLI 一次登入

所有 skill 背後都呼叫 inference.sh 的 belt。第一次裝完先 login,確認 app 清單能撈出來。撈得到即代表帳號與權限已接上,後續由 agent 接管。

belt login belt app list
不需要各自的 API key。安裝後無需分別申請 OpenAI、Google、Anthropic、Tavily、X 的 key。belt 以 inference.sh 統一帳號管理 250+ 模型的存取權,所有計費與用量集中在單一地方。這是本 repo 與其他彙整倉庫的主要差別。
03
五大工具 · 兩種 SDK · 三套 UI

repo 四層結構:tools、sdk、ui、guides 各層的代表入口

整個 repo 拆成四層:tools/ 是 agent 直接呼叫的能力、sdk/ 給開發者寫程式接、ui/ 給 web app 嵌入、guides/ 是內容工作流範本。下面 12 張卡片把四層的代表性入口列出來。

Tool · 01
ai-image-generation
圖像生成主管
50+ 模型,包括 FLUX、Gemini、Revé。agent 講「畫一張」就會路由進來,可指定風格、長寬比、批次量。
Tool · 02
ai-video-generation
影片生成主管
40+ 模型,Veo、Sora、Runway、WAN 收在同一介面。短片、產品宣傳片、社群短片場景全包。
Tool · 03
llm-models
LLM 路由
Claude、Gemini、Kimi、GLM 走同一個 skill。讓 agent 能做 cross-model A/B、second opinion,不必綁死一家。
Tool · 04
web-search
即時情報員
Tavily 與 Exa 雙搜尋引擎,適合做研究、找新聞、補上 LLM 訓練資料截止後的事實。
Tool · 05
twitter-automation
社群手腳
X / Twitter API 整合,agent 能讀串、發文、抓帳號活動。行銷自動化的最後一哩。
SDK · 06
javascript-sdk
TS React
JavaScript / TypeScript SDK,支援 streaming 與 React 元件直接渲染。做 chatbot 與 dashboard 必備。
SDK · 07
python-sdk
Python 非同步
async 與 streaming 都覆蓋,適合做後端 worker、爬蟲管線、批次任務。資料管線首選。
UI · 08
agent-ui
完整 Agent 介面
整套可嵌入的 agent 對話介面,包含工具呼叫狀態、結果渲染、串流動畫。自家 app 抄完就能跑。
UI · 09
chat-ui
對話元件
比 agent-ui 更輕,只給你 chat 部分。需要客製外觀、自己控制 layout 時用。
UI · 10
tools-ui
工具卡渲染
專做 tool call 與 result 卡片的視覺化,把 agent 跑了哪些 skill、回了什麼,漂亮地秀給用戶。
Guide · 11
guides/prompting
Prompt 範本庫
Prompt Engineering 與影片提詞範本。社群試出來的好招直接寫成 SKILL.md 收進專案。
Guide · 12
guides/design+social
內容工作流
Landing page、Thumbnail、Logo、Storyboard、LinkedIn 文、Twitter 串、Carousel 全套範本,行銷與設計團隊直接套用。

你想做什麼,用哪一條?

場景 該裝的 skill / 模組 主要呼叫
出圖 · 視覺素材 @flux-image · ai-image-generation FLUX、Gemini、Revé
出影片 · 短片 @google-veo · ai-video-generation Veo、Sora、Runway、WAN
多模型比稿 · second opinion @llm-models Claude、Gemini、Kimi、GLM
研究 · 補事實 @web-search Tavily、Exa
社群排程 · 發推 twitter-automation X / Twitter API
自家 web app 嵌入 agent javascript-sdk + agent-ui React stream + tool cards
後端批次任務 python-sdk async 呼叫 belt
04
進階用法 · POWER PATTERNS

六個配置模式提升 agent 出貨效率。

以下六條均從 README 與 repo 目錄結構推導,是安裝後容易被忽略、但對 agent 出貨效率影響明顯的配置細節。所有指令路徑均對應 README 原文。

TIP 01

用 marketplace add 走 plugin 路線

/plugin marketplace add inference-sh/skills 一次掛上整個 marketplace,後續 inference.sh 新增 skill 不用重灌,重啟 Claude Code 就會看到新功能。長期維護成本最低。

來源 · README · Plugin install
TIP 02

單一 skill 走 npx 更輕

不需要 250+ 模型全部?npx skills add inference-sh/skills@flux-image 只裝 FLUX 出圖,Skill 體積最小,agent 上下文也最精簡。上下文越短,模型挑工具越準確。

來源 · README · npx skills add
TIP 03

guides/ 的用途:作為 prompt 範本,而非說明文件

guides/promptingdesignvideosocial 均已寫成 SKILL.md 結構。agent 偵測到「我要寫 LinkedIn 文」時會自動套用 social guide 的 voice 與結構。使用時應將其視為 prompt 範本,而非說明文件。

來源 · repo · guides/ 目錄
TIP 04

llm-models 跑 cross-model A/B

同一段 prompt 分別送 Claude 與 Gemini 各跑一次,讓 agent 對齊輸出。相較於單一模型,輸出一致性較高,在中文內容與長篇結構化文案上差異尤為明顯。

來源 · README · llm-models tool
TIP 05

SDK 與 plugin 不互斥

Claude Code 裡用 plugin 路線跑互動,後端自家 worker 直接走 python-sdk 呼叫 belt 同一帳號。兩條路同個 inference.sh 帳號計費,你的內容生產線變一站式。

來源 · repo · sdk/ 目錄
TIP 06

agent-ui 直接打包 chatbot

ui/agent-uisdk/javascript-sdk 接起來,加上 tools-ui 顯示工具狀態,約 15 分鐘即可組出可運行的自家 agent。工具呼叫與結果自動渲染,含 streaming 動畫。

來源 · repo · ui/ + sdk/
05
實際走一輪

以製作社群短片為例:五條 skill 接力完成研究至發文。

以下示範製作一支 60 秒 SaaS 產品短片並搭配 X 串文。環境條件:已完成 belt login,Claude Code 裝有 inference-sh skills。輸入一句意圖,五個 skill 依序執行,全程無需手動切換 SDK 或 API key。

~/projects/saas-promo · claude code · inference-sh skills
You › 幫我做一支介紹我家 SaaS 的 60 秒短片,中文旁白配 X 串文
[claude code] 解析意圖 → 需要 5 個 skill 接力 · web-search:找 2026 競品的短片風格 · llm-models:寫 60 秒腳本與旁白 · ai-image-generation:出 storyboard frame · ai-video-generation:合成短片 · twitter-automation:排程 X 串文
[1/5 · web-search · Tavily] 查「中文 SaaS 短片 2026 範例」 → 抓 6 篇 → Claude 萃取共性:節奏快、文字覆蓋層、單一賣點
[2/5 · llm-models · Claude] 產出 60 秒腳本 · 6 個 shot · 旁白逐字稿 → cross-check 給 Gemini 跑一輪,修字詞節奏
[3/5 · ai-image-generation · FLUX] 生 6 張 storyboard frame · 1408×768 中文標題覆蓋層 · CJK 安全留白
[4/5 · ai-video-generation · Veo] 以 6 張 storyboard 為 reference 合成 60 秒 → /Downloads/saas-2026-promo.mp4
[5/5 · twitter-automation] 產 3 則 X 串文 · 排程 09:00 / 12:00 / 18:00 → 排隊 ID xxxxxxx · 可手動驗收後送出
完成 · 5 條 skill 接力 · 共耗時 14 分 [單一 belt 帳號結帳,沒有任何外部 API key]
五條 skill 接力,從研究、文案、storyboard、影片合成到社群排程,單一對話完成。
— inference-sh/skills 核心使用場景

這條流程值得拆解的點

一個帳號管理 250+ 模型存取。agent 不用切換 SDK 與 API key,失敗率與整合成本同步壓低。對小團隊來說最大的省事在「不用再為每個服務報帳」。

guides/ 在背景影響 prompt。即使你沒明說「寫得有節奏」,llm-models 跑 LinkedIn 或 X 文時會自動帶上 guides/social 的範本。voice 一致性是被 guides 而非 prompt 推動的。

skill 可任意替換。storyboard 可改用 Gemini 出、影片可改用 Runway 合成、推文可改為人工撰寫。關掉對應 skill 即可,流程不綁定單一供應商。

06
使用前注意

已知限制與部署前須確認的事項。

  • 需要 inference.sh 帳號加 belt CLI。belt 需連接 inference.sh 後端,離線環境無法運行。須先至 inference.sh 完成帳號註冊方可開始使用。
  • 模型可用性會隨上游政策變。250+ 模型清單由 inference.sh 後端維護。Sora、Veo 之類新模型可能因供應商限制突然調整配額,production workflow 不要綁死單一模型,要保留替代品。
  • Twitter / X 自動化遵守平台政策。twitter-automation 走 X API,免費層級每月有貼文與讀取量上限。大量自動發文之前先看你的 X 帳戶等級,以及最新的自動化政策。
  • 影片合成成本明顯。ai-video-generation 呼叫的是上游影片模型,每段 5–60 秒成本可能是純文字生成的數十倍。先在 dev 環境用低解析度跑通流程再上量。
  • guides/ 提供引導,不強制執行。prompt 與內容範本是給 agent 的建議引導,agent 不一定照走。若需鎖定固定對外語氣,須在 CLAUDE.md 另行撰寫 voice 規則。
  • UI 元件假設你用 React。agent-uichat-uitools-ui 都是 React。原生 app 或非 web 場景需要自己重寫,SDK 反而比較好遷移。
  • 不要把 belt token 提到 commit。belt 認證與 API key 雖然集中管理,但本機 config 還是要當作敏感資料,不要 push 到 public repo。.gitignore 先確認過再開始用。
  • Plugin 與 npx 兩條路線別混裝。同一台機器混裝兩種路徑容易出現「兩份 skill」相互覆蓋,出問題時很難追。選一種裝法,團隊內統一。
07
進階路徑

將四層結構接進現有工作流的五種方式。

tools / sdk / ui / guides 四層完全解耦。任意一層可單獨使用,其餘三層可替換或省略,因此可漸進式接入現有工作流,無需整套遷移。

進階玩法地圖

1. fork tools/ 加新供應商。inference.sh 還沒接的小模型(例如自家 fine-tune),仿照 tools/ai-image-generation 的 SKILL.md 結構加一個資料夾,丟回 marketplace 就能讓所有 agent 用。

2. 把 sdk/ 接進自家後端。python-sdk 的 async + streaming 讓你能把 inference.sh 變成內部 「AI Gateway」,團隊所有腳本一律走同一條,計費與用量集中監控。

3. 換掉 guides/ 變成你的 brand voice。guides/socialguides/writing 是 SKILL.md,可以複製一份改成公司語氣,picker 會優先讀你公司版本。一份檔案管全公司語氣。

4. 接 agent-ui 做客戶 demo。ui/agent-ui + sdk/javascript-sdk 串起來就是一個能 demo 工具呼叫的 chatbot,給銷售拿去 demo 給客戶最直接。

5. 把 belt 包進 CI。belt 為純命令列工具,可在 GitHub Actions 與內部 CI 執行批次任務,例如每週自動生成報表縮圖、thumbnail、研究摘要,無需人工介入。

最該讀的三份延伸閱讀

cli-install.md:belt CLI 完整安裝與權限設定流程。
inference.sh/docs:belt 全部指令、帳號管理、計費機制,及 250+ 模型最新清單。
CONTRIBUTING.md:新增 tool、SDK、guide 的 PR 流程,及命名與 SKILL.md 撰寫規範。

inference-sh/skills 將研究、文案、視覺、影片、社群五條工作流收進同一個 belt 帳號,統一計費與存取管理。
— inference-sh/skills 設計目標