實戰手冊 · Field Manual 2026 春季號 · v1.5
github.com/luoluoluo22/jianying-editor-skill · 2.2k ★
第 01 期 · AI 影音自動化 / Agent Skill

自然語言,
讓 Agent 跑完
剪映剪輯。

jianying-editor-skill 是一個開源的 Agent 技能,讓 Claude Code、Cursor、Trae、Antigravity 透過自然語言操作剪映專業版,自動完成腳本、配音、字幕、配樂、特效、錄屏與 MP4 匯出。所有剪輯動作由 Python 腳本驅動,最終仍透過剪映原生程式算圖輸出。

2.2k
GitHub Stars
11
自動化能力
4K
最高匯出畫質
MIT
開源授權
01
這到底是什麼

一個讓 Agent
操作剪映的技能。

jianying-editor-skill 是一套放進 AI 編輯器的技能檔。安裝後,Claude Code、Cursor、Trae、Antigravity 這類 Agent 就能讀取它的規則,把你用自然語言描述的剪輯需求,翻成一連串對剪映專業版的實際操作。你說「把這個資料夾的影片剪成 Vlog,配輕快音樂、加旁白字幕」,它就從腳本、配音、字幕、配樂一路做到匯出 MP4。

它的核心不是新的剪輯軟體,而是一批 Python 腳本加上 Markdown 規則。腳本透過內建的 pyJianYingDraft 直接讀寫剪映的草稿檔,Markdown 規則(rules/ 目錄)則告訴 Agent 遇到哪種任務該走哪條流程。最終算圖仍由剪映原生程式完成——它不是剪映的替代品,而是替你操作剪映的那雙手。

v1.5 起加入了幾項自動化:自動修復會偵測並修復損壞或過期的草稿;雲端配樂庫挖掘會萃取你過去用過的剪映雲端音樂 ID 供 AI 重用;語意素材匹配讓 AI 分析旁白語意,自動挑出對應畫面。整條流程被切成五個固定階段,前一階段的產出由後一階段自動接手。

Agent 執行迴圈 · 五個階段
初始化 路由請求 執行操作 素材整合 匯出
用自然語言描述需求,AI 從腳本、配音、字幕、配樂到匯出一次完成。
— jianying-editor-skill README · 一句話定義
02
安裝

一行指令安裝,
四種 Agent 通用。

先備齊環境:剪映專業版 5.9 或更早、Python、Git。Windows 使用者可用一行 PowerShell 一鍵安裝;其他平台依你的 AI 編輯器選對應路徑手動 clone。

Windows 一鍵安裝

# Windows · 一鍵安裝(PowerShell) irm is.gd/rpb65M | iex

手動安裝:依編輯器選路徑

每種 AI 編輯器的技能目錄不同。把 repo clone 到對應位置即可——指令只差最後的路徑。

# Antigravity / Gemini git clone https://github.com/luoluoluo22/jianying-editor-skill.git .agent/skills/jianying-editor # Trae IDE git clone https://github.com/luoluoluo22/jianying-editor-skill.git .trae/skills/jianying-editor # Claude Code git clone https://github.com/luoluoluo22/jianying-editor-skill.git .claude/skills/jianying-editor # Cursor / VSCode / 通用 git clone https://github.com/luoluoluo22/jianying-editor-skill.git skills/jianying-editor

安裝相依套件

clone 完後安裝 Python 相依套件,並讓 Playwright 下載 Chromium(網頁轉影片與部分自動化會用到)。日後更新只要進目錄 git pull

# 安裝相依套件 pip install -r requirements.txt playwright install chromium # 日後更新 cd .agent/skills/jianying-editor && git pull
務必使用剪映專業版 5.9 或更早。v6.0+ 的 UI 彈窗太多,會中斷自動化、導致自動匯出失敗。官方提供 5.9 安裝包(夸克網盤),裝好後請關閉自動更新。macOS 為實驗性支援,無自動匯出,需手動匯出。
03
能力總覽

十一項剪輯能力,
各對應一支腳本。

每項能力背後都是一支可獨立執行的 Python 腳本,Agent 依任務挑選並串接。下表把十一項能力依工作階段分組:素材負責匯入與特效,音訊負責配音、字幕、配樂,生成負責錄製與影視解說,輸出負責匯出、動畫與複合片段。你不必記腳本名稱——用自然語言描述需求即可,Agent 會自行路由。

素材 · 01
add_media_safe()
素材匯入
自動把影片、音訊、圖片排進時間軸,並處理路徑與軌道對齊。
素材 · 02
asset_search.py
特效 / 轉場 / 濾鏡
依關鍵字在內建素材庫搜尋並套用特效、轉場與濾鏡,毋須記名稱。
音訊 · 03
TTS · 原生 / 微軟
AI 配音
把文字轉成語音,支援剪映原生音色與微軟 TTS,多種語言與聲線。
音訊 · 04
add_narrated_subtitles()
字幕生成
字幕自動對齊配音時間軸,並可套上進場與動畫效果。
音訊 · 05
build_cloud_music_library.py
自動配樂
從本地或雲端音樂庫挑選 BGM,並依主題推薦合適的背景音樂。
生成 · 06
web_recorder.py
網頁轉影片
用 Playwright 錄製 HTML / Canvas 動畫,把網頁畫面變成可用素材。
生成 · 07
recorder.py
螢幕錄製 + 智慧變焦
錄製螢幕並自動變焦到游標,加上紅圈標記,適合做操作教學。
生成 · 08
movie_commentary_builder.py
影視解說
AI 分析影片內容,自動產生分鏡腳本與配音,做成影視解說。
輸出 · 09
auto_exporter.py
自動匯出
直接輸出 MP4,畫質從 1080P 到 4K,可指定解析度與幀率。
輸出 · 10
jy_wrapper.py apply-zoom
關鍵影格動畫
以關鍵影格做縮放、位移、不透明度動畫,搭配 CV 輔助的智慧變焦。
輸出 · 11
jy_wrapper.py clone
複合片段
把多個專案嵌套成一個複合片段,或以模板複製成新專案。

哪種任務走哪條路由?

Agent 依任務類型比對 rules/ 目錄裡的規則檔,再呼叫對應腳本。下表是 SKILL.md 中記載的主要路由。

任務 路由規則檔 核心腳本
雲端影片 + BGM + 配音 media.md + audio-voice.md cloud_video_music_tts_demo.py
腳本轉影片(旁白 + 字幕) text.md + audio-voice.md add_narrated_subtitles()
螢幕錄製 + 變焦 recording.md recorder.py
批次 / 無頭匯出 core.md + cli.md robust_auto_export.py
影視解說 generative.md movie_commentary_builder.py
04
核心腳本 · 官方原則

你會用到的
命令列工具

多數時候你只需用自然語言下指令,但了解底層腳本能讓你更精準地除錯與微調。以下是 SKILL.md 與 README 記載、可直接在終端執行的工具與機制。指令中的 <SKILL_ROOT> 是你的安裝路徑。

01

先盤點再動手

draft_inspector.py 用來列出與檢視草稿。list --limit 20 列出最近草稿,summary --name "DraftName" 看摘要,show --kind content --json 匯出完整結構。

來源 · SKILL.md
02

用名稱找素材

asset_search.py "關鍵字" -c filters 在內建素材庫依關鍵字搜尋濾鏡、轉場與特效;sync_jy_assets.py 則同步剪映本地素材索引。

來源 · SKILL.md
03

自動修復草稿

初始化時 JyProjectoverwrite=True 實例化,會偵測並修復損壞或過期的草稿檔,對應 5.9+ 的 draft_info.json 架構,避免半成品卡住流程。

來源 · SKILL.md · v1.5
04

雲端配樂庫挖掘

build_cloud_music_library.py 萃取你過去在剪映用過的雲端音樂 ID,寫入 cloud_music_library.csv,讓 AI 重用你熟悉的 BGM。文字樣式也有對應的 build_cloud_text_styles_library.py

來源 · README · v1.5
05

語意素材匹配

AI 會分析旁白或腳本的語意,自動從你的素材庫挑出對應畫面,減少手動對軌的工夫。這是 v1.5 強調的「會看懂內容」的能力。

來源 · README · v1.5
06

無頭批次匯出

auto_exporter.py "DraftName" "output.mp4" --res 1080 --fps 60 可在不開介面的情況下匯出指定草稿,方便批次處理。匯出期間請勿操作滑鼠鍵盤。

來源 · SKILL.md
07

網頁轉素材

web_recorder.py --url "http://localhost:3000" --duration 5 以 Playwright 錄製 HTML / Canvas 動畫,把任意網頁畫面變成可放進時間軸的影片素材。

來源 · SKILL.md
08

環境自檢

遇到問題先跑 api_validator.py 驗證 API 與環境設定是否就緒,再用 jy_wrapper.py export-srt --name "DraftName" 之類的封裝指令做單點操作。

來源 · SKILL.md
05
使用實例

從一句話,
匯出 MP4

以下是一段示意流程:你給 Agent 一個資料夾與一句話,它會路由到對應規則、盤點草稿、搜尋濾鏡、生成旁白與字幕、配上雲端音樂,最後無頭匯出 1080P。指令均為 SKILL.md 記載的真實語法;素材搜尋結果僅示意,實際內容依你的剪映素材庫而定。

claude code · jianying-editor-skill v1.5
You › 把 D:\trip 的影片和照片剪成 Vlog,配輕快音樂、 加旁白和字幕,最後匯出 1080P。
[loaded .claude/skills/jianying-editor/SKILL.md] [route → rules/media.md + rules/audio-voice.md] [init JyProject(overwrite=True) · 自動修復檢查通過]
Claude › 先盤點現有草稿與素材,再開始組裝時間軸。
$ python scripts/draft_inspector.py list --limit 20 找到 8 個草稿 · 無同名衝突 → 建立 "Trip-Vlog"
$ python scripts/sync_jy_assets.py 已同步本地素材索引
$ python scripts/asset_search.py "輕快" -c filters 回傳符合關鍵字的濾鏡 / 轉場候選(示意)
[匯入 D:\trip · 影片 x12 · 照片 x9 → 時間軸] [add_narrated_subtitles() · 生成旁白 + 對齊字幕] [查詢 cloud_music_library.csv · 依「輕快」推薦 BGM]
Claude › 草稿已組好。剪映草稿不會即時刷新,稍後請切換專案查看。 接著做無頭匯出——匯出期間請勿操作滑鼠鍵盤。
$ python scripts/auto_exporter.py "Trip-Vlog" "D:\out\trip.mp4" --res 1080 --fps 60
匯出完成 · D:\out\trip.mp4 · 1080P / 60fps 時長 01:12 · 旁白 + 字幕 + BGM 已就緒
你給一個資料夾和一句話,
它回給你一支可發布的 MP4。
— 自然語言 → 路由 → 腳本 → 匯出

這段流程為什麼這樣跑

關鍵在於路由:Agent 不是憑感覺剪片,而是先把「Vlog + 配樂 + 旁白」比對到 rules/media.mdrules/audio-voice.md,再呼叫各自的腳本。每一步的產出(草稿、字幕、配樂)都寫進剪映草稿檔,由下一步接手。

也因此它不是黑箱:你能用 draft_inspector.py 查看任一階段的草稿結構,卡關時自己介入。最終算圖仍由剪映完成,品質與你手動操作一致。

06
先看清楚這些

知道邊界,
再開始用。

  • 自動匯出只支援剪映專業版 5.9 或更早。v6.0+ 的 UI 彈窗太多,會中斷自動化流程、導致自動匯出失敗。建議環境為 Windows + 剪映專業版 5.9,並關閉自動更新。
  • macOS 為實驗性支援。路徑、草稿、錄製有部分支援,但沒有自動匯出,需在剪映裡手動匯出。完整端到端流程目前仍以 Windows 為準。
  • 不支援 CapCut 國際版與手機版。僅支援中國大陸的剪映專業版桌面程式,海外 CapCut 與行動版剪映皆無法使用。
  • 它不是剪映的替代品。所有影片最終仍透過剪映原生程式算圖輸出;這個技能負責的是替你操作剪映,而非自己渲染。
  • 不會觸發剪映內建的即時 GPU 特效。智慧摳像、美顏、語音轉文字等需要 GPU 的即時功能,以及「一鍵成片」「圖文成片」等內建 AI,都無法由腳本驅動。
  • 草稿不會即時刷新。生成後在剪映裡看不到新草稿是正常的——重啟剪映或切換到別的專案再切回來,即可看到。
  • 匯出期間不要動滑鼠鍵盤。自動匯出使用模擬輸入操作介面,過程中操作滑鼠或鍵盤會打斷腳本、導致匯出失敗。
  • 需要先裝好 Python 與 Playwright。網頁轉影片與部分自動化依賴 Playwright/Chromium,安裝時請確實執行 pip install -r requirements.txtplaywright install chromium
07
進階路徑

把它改成你自己的流程。

路由邏輯寫在 rules/ 目錄的 Markdown 規則檔裡,腳本則放在 scripts/。兩者都可閱讀、可修改——你能調整流程、建立自己的素材庫,讓 Agent 越用越貼合你的剪輯習慣。

進階玩法地圖

1. 客製化路由規則。打開 rules/media.mdrules/audio-voice.md 等檔案,調整 Agent 對各類任務的處理流程與預設值,毋須改 Python。

2. 建立你自己的雲端素材庫。build_cloud_music_library.pybuild_cloud_text_styles_library.py,把你慣用的雲端音樂與文字樣式 ID 萃取成資料庫,供 AI 重用。

3. 用模板複製專案。jy_wrapper.py clone --template "TemplateName" --name "NewProject" 可從既有專案複製出新草稿,適合系列影片維持一致風格。

4. 把網頁動畫做成片頭。web_recorder.py 錄製你寫的 HTML / Canvas 動畫(例如星空粒子片頭),再匯入時間軸,做出自訂的開場。

5. 做影視解說。movie_commentary_builder.py --video "video.mp4" --json "storyboard.json" 讓 AI 分析影片、產出分鏡與配音,快速做出長片解說。

最該讀的三份文件

README.md——安裝、平台支援、能力總覽與限制。
SKILL.md——Agent 實際讀取的規格:腳本指令、執行迴圈與路由規則。
usage.md——更完整的使用情境與範例。

這不是剪映的替代品 —
它透過原生程式算圖輸出。
— jianying-editor-skill README · 限制說明