inference-sh/skills 將 FLUX、Veo、Sora、Runway、Claude、Gemini、Tavily、Exa、X / Twitter API 封裝為 Claude Skills。一條 /plugin install 裝完,agent 即可呼叫圖像生成、影片合成、LLM 推論、網路搜尋及社群自動化,無需分別申請各家 API key 或學習各家 SDK。
inference-sh/skills 將圖像、影片、LLM、搜尋、Twitter 五類服務封裝為 Claude Skills,底層透過 belt CLI 統一呼叫。inference-sh/skills 把各家 SDK 與 API key 的差異收進 belt,agent 拿到的是一份標準化的能力清單,而非分散的服務端點。
目錄結構分四層:tools/ 五大類能力(圖、影片、LLM、搜尋、Twitter)、sdk/ JS 與 Python 兩種接法、ui/ 可嵌入網頁 agent 的元件、guides/ 內容工作流範本(文案、設計、影片腳本、社群)。inference.sh 負責後端 250+ 模型的供應,執行 belt login 取得帳號權限後,即可呼叫 FLUX 出圖、Veo 出影片、Tavily 搜尋新聞、Claude 或 Gemini 跑文字任務。
設計重點在 plugin 化:一條 /plugin install inference-sh 裝完,Claude Code 在對話中偵測到「畫一張」「找新聞」「發推文」等意圖時,會自動路由至對應 skill。使用者下達意圖,工具選擇由 agent 處理。
環境只要 Claude Code 加上 inference.sh 的 CLI belt。先到 inference.sh 註冊帳號、跑 belt login 拿到 API 權限,再選一種裝法:整套裝、單一技能裝、或手動 cp 進 skills 目錄。
不想把整個 marketplace 都拉進來,可以用 npx skills add 指定 @<name> 只裝一個。例如做設計只需要 FLUX 出圖、做行銷只需要 Twitter 自動化,各裝各的:
所有 skill 背後都呼叫 inference.sh 的 belt。第一次裝完先 login,確認 app 清單能撈出來。撈得到即代表帳號與權限已接上,後續由 agent 接管。
整個 repo 拆成四層:tools/ 是 agent 直接呼叫的能力、sdk/ 給開發者寫程式接、ui/ 給 web app 嵌入、guides/ 是內容工作流範本。下面 12 張卡片把四層的代表性入口列出來。
| 場景 | 該裝的 skill / 模組 | 主要呼叫 |
|---|---|---|
| 出圖 · 視覺素材 | @flux-image · ai-image-generation |
FLUX、Gemini、Revé |
| 出影片 · 短片 | @google-veo · ai-video-generation |
Veo、Sora、Runway、WAN |
| 多模型比稿 · second opinion | @llm-models |
Claude、Gemini、Kimi、GLM |
| 研究 · 補事實 | @web-search |
Tavily、Exa |
| 社群排程 · 發推 | twitter-automation |
X / Twitter API |
| 自家 web app 嵌入 agent | javascript-sdk + agent-ui |
React stream + tool cards |
| 後端批次任務 | python-sdk |
async 呼叫 belt |
以下六條均從 README 與 repo 目錄結構推導,是安裝後容易被忽略、但對 agent 出貨效率影響明顯的配置細節。所有指令路徑均對應 README 原文。
/plugin marketplace add inference-sh/skills 一次掛上整個 marketplace,後續 inference.sh 新增 skill 不用重灌,重啟 Claude Code 就會看到新功能。長期維護成本最低。
不需要 250+ 模型全部?npx skills add inference-sh/skills@flux-image 只裝 FLUX 出圖,Skill 體積最小,agent 上下文也最精簡。上下文越短,模型挑工具越準確。
guides/prompting、design、video、social 均已寫成 SKILL.md 結構。agent 偵測到「我要寫 LinkedIn 文」時會自動套用 social guide 的 voice 與結構。使用時應將其視為 prompt 範本,而非說明文件。
同一段 prompt 分別送 Claude 與 Gemini 各跑一次,讓 agent 對齊輸出。相較於單一模型,輸出一致性較高,在中文內容與長篇結構化文案上差異尤為明顯。
來源 · README · llm-models toolClaude Code 裡用 plugin 路線跑互動,後端自家 worker 直接走 python-sdk 呼叫 belt 同一帳號。兩條路同個 inference.sh 帳號計費,你的內容生產線變一站式。
將 ui/agent-ui 與 sdk/javascript-sdk 接起來,加上 tools-ui 顯示工具狀態,約 15 分鐘即可組出可運行的自家 agent。工具呼叫與結果自動渲染,含 streaming 動畫。
以下示範製作一支 60 秒 SaaS 產品短片並搭配 X 串文。環境條件:已完成 belt login,Claude Code 裝有 inference-sh skills。輸入一句意圖,五個 skill 依序執行,全程無需手動切換 SDK 或 API key。
一個帳號管理 250+ 模型存取。agent 不用切換 SDK 與 API key,失敗率與整合成本同步壓低。對小團隊來說最大的省事在「不用再為每個服務報帳」。
guides/ 在背景影響 prompt。即使你沒明說「寫得有節奏」,llm-models 跑 LinkedIn 或 X 文時會自動帶上 guides/social 的範本。voice 一致性是被 guides 而非 prompt 推動的。
skill 可任意替換。storyboard 可改用 Gemini 出、影片可改用 Runway 合成、推文可改為人工撰寫。關掉對應 skill 即可,流程不綁定單一供應商。
twitter-automation 走 X API,免費層級每月有貼文與讀取量上限。大量自動發文之前先看你的 X 帳戶等級,以及最新的自動化政策。
ai-video-generation 呼叫的是上游影片模型,每段 5–60 秒成本可能是純文字生成的數十倍。先在 dev 環境用低解析度跑通流程再上量。
agent-ui、chat-ui、tools-ui 都是 React。原生 app 或非 web 場景需要自己重寫,SDK 反而比較好遷移。
.gitignore 先確認過再開始用。
tools / sdk / ui / guides 四層完全解耦。任意一層可單獨使用,其餘三層可替換或省略,因此可漸進式接入現有工作流,無需整套遷移。
1. fork tools/ 加新供應商。inference.sh 還沒接的小模型(例如自家 fine-tune),仿照 tools/ai-image-generation 的 SKILL.md 結構加一個資料夾,丟回 marketplace 就能讓所有 agent 用。
2. 把 sdk/ 接進自家後端。python-sdk 的 async + streaming 讓你能把 inference.sh 變成內部 「AI Gateway」,團隊所有腳本一律走同一條,計費與用量集中監控。
3. 換掉 guides/ 變成你的 brand voice。guides/social、guides/writing 是 SKILL.md,可以複製一份改成公司語氣,picker 會優先讀你公司版本。一份檔案管全公司語氣。
4. 接 agent-ui 做客戶 demo。ui/agent-ui + sdk/javascript-sdk 串起來就是一個能 demo 工具呼叫的 chatbot,給銷售拿去 demo 給客戶最直接。
5. 把 belt 包進 CI。belt 為純命令列工具,可在 GitHub Actions 與內部 CI 執行批次任務,例如每週自動生成報表縮圖、thumbnail、研究摘要,無需人工介入。
① cli-install.md:belt CLI 完整安裝與權限設定流程。
② inference.sh/docs:belt 全部指令、帳號管理、計費機制,及 250+ 模型最新清單。
③ CONTRIBUTING.md:新增 tool、SDK、guide 的 PR 流程,及命名與 SKILL.md 撰寫規範。