實戰手冊 · Field Manual 2026 春季號

github.com/minsight-ai-info/AI-Search-Hub · 1.1k ★

第 01 期 · 開源工具 / AI 搜尋 / Agent

AI Search Hub：單一介面整合 8+ 個 AI 平台原生搜尋。

AI Search Hub 是一套開源 skill,把 Gemini、Grok、豆包、元寶、LongCat、通義千問、MiniMax、Kimi 的原生搜尋與資料抽取整合成單一介面。一個查詢同時送進多個平台，無需為每個來源維護爬蟲、瀏覽器自動化或登入流程。

1.1k

GitHub Stars

支援平台

Python

100% 原生實作

MIT

永久免費授權

工具定位

借用各大廠的原生搜尋，而非自行維護爬蟲。

要取得微信公眾號、抖音、微博、X 的即時資料，傳統做法是為每個平台撰寫爬蟲、維護瀏覽器自動化、處理登入與驗證碼。AI Search Hub 採用不同路徑：這些大廠的 AI 助手（豆包、元寶、Kimi、Grok…）本身具備原生搜尋與資料抽取能力，本工具直接借用它們的搜尋介面，而不是另行建置一套抓取系統。

專案定位明確：它不繞過平台，而是站在平台官方搜尋之上。將 Gemini、Grok、豆包、元寶、LongCat、通義千問、MiniMax、Kimi 八個平台的搜尋能力整合成統一介面。一個查詢送入後，路由到合適的平台，各平台以自己的生態回答，結果收斂成 Agent / workflow 可直接消費的格式。

核心入口是 Python 腳本 scripts/run_web_chat.py，搭配 ROUTING.md 決定哪類問題指向哪個平台，agents/openai.yaml 則提供 Agent 隱式呼叫設定。設計目標是以大廠原生搜尋框架取代自建爬蟲，覆蓋 Google、X 即時、抖音/微博趨勢、微信公眾號等一般難以直接抓取的內容。

AI Search Hub · 單查詢多平台流程

一個查詢→ ROUTING 選平台→ 平台原生搜尋→ 統一輸出→ Agent 消費

AI Search Hub 把各大廠的原生搜尋接進 Agent，無需自建抓取層。

— AI Search Hub README · 專案定位

安裝與第一次查詢

以 Python 腳本向指定平台送出查詢。

環境需求：Python 3、Chrome 瀏覽器（供自動化使用）、以及目標平台帳號。clone 後，所有查詢透過 scripts/run_web_chat.py 執行，以 --site 指定平台、--prompt 傳入查詢、--output 指定輸出檔案路徑。

git clone https://github.com/minsight-ai-info/AI-Search-Hub.git
cd AI-Search-Hub
# 一個查詢打進指定平台
python3 scripts/run_web_chat.py \
  --site [platform] \
  --prompt "[query]" \
  --output [filepath]
      

實際跑一次:用豆包查新疆旅遊路線

第一次跑某個平台時,腳本會開一個 Chrome debug session 等你登入該平台;登入過後即可正常呼叫。下面是 README 給的範例:

python3 scripts/run_web_chat.py --site doubao \
  --prompt "新疆旅遊路線" \
  --output out/result.txt
      

給 Agent 用:隱式呼叫。agents/openai.yaml 是 Agent 介面設定範例,定義顯示名稱、描述,以及 Chrome debug 啟動與等待登入的行為。配置好之後,Agent 可以在 workflow 裡隱式觸發 AI Search Hub,而不必每次手敲腳本參數。

支援平台總覽

八個平台，各有不同的搜尋生態與資料覆蓋範圍。

八個平台各有不同的資料生態：部分擅長即時社群、部分覆蓋中文趨勢、部分接入 Google 網頁結果。以 --site 選擇正確平台，即選定了對應的內容來源。Perplexity 與 Claude 已標註為計畫支援項目。

即時社群 · 01

--site grok

X 即時脈動

借 Grok 拿 X/Twitter 的即時貼文。README 範例查 Elon Musk 近況,輸出依日期排序、附連結,含 Starlink、SpaceX、xAI 等主題。

Google 網頁 · 02

--site gemini

Google 網頁結果

借 Gemini 取用 Google 的網頁搜尋生態,適合需要廣泛 web 來源、英文與國際內容的查詢。

中文生態 · 03

--site doubao

豆包 中文主場

字節跳動的豆包,中文趨勢與抖音生態的強項。README 範例查「新疆旅遊路線」,回多日行程、含天池/喀納斯/賽里木湖。

中文生態 · 04

--site yuanbao

元寶 微信生態

騰訊元寶，擅長微信公眾號與騰訊系內容。這類資料傳統爬蟲不易取得，透過平台原生搜尋可直接存取。

影音榜單 · 05

--site minimax

MiniMax 影音趨勢

README 範例查 Bilibili 熱門影片,聚合遊戲、戶外、生活等分類的排行結果,適合影音內容趨勢盤點。

長文問答 · 06

--site kimi

Kimi 長文檢索

月之暗面 Kimi,長上下文與資料整理見長,適合需要把多來源整理成結構化長答的查詢。

綜合中文 · 07

--site tongyi

通義千問綜合

阿里通義千問,涵蓋廣泛中文知識與電商/阿里系生態,做中文綜合查詢的另一條主線。

輕量快查 · 08

--site longcat

LongCat 快查

LongCat 作為支援平台之一,用於擴充查詢來源的覆蓋面。實際強項依平台當前能力為準。

問題型態 → 該打哪個生態?

這是 ROUTING.md 的核心:依問題型態與目標資料生態選平台。以下對應依 README 所述的內容覆蓋與範例整理,實際路由規則以 ROUTING.md 為準。

你想找什麼	資料生態	建議平台
即時社群動態、人物近況	X / Twitter 即時	`grok`
國際網頁、英文資料	Google 網頁結果	`gemini`
中文趨勢、抖音/微博熱點	中文社群趨勢	`doubao` · `tongyi`
微信公眾號內容	騰訊 / 微信生態	`yuanbao`
影音榜單、Bilibili 熱門	影音內容趨勢	`minimax`

操作要點 · 來自 README / docs

查詢品質取決於路由選擇是否正確。

以下操作要點全部來自 README 與專案文件。核心問題是：同一個問題應送往哪個平台。依 ROUTING.md 的策略選對生態，是取得有效結果的前提。

TIP 01

選對平台,比優化關鍵字更關鍵

依 README 說明，關鍵字優化仍有必要，但比傳統做法省力。決定結果品質的關鍵是 --site 選對生態。查 X 即時用 grok、查微信公眾號用 yuanbao。平台選錯，關鍵字再精確也無法取得正確資料。

來源 · 官方 README · Limitations

TIP 02

它不是爬蟲,所以沒有破驗證碼問題

因為站在平台官方搜尋之上,你不需要處理 CAPTCHA、反爬、IP 封鎖這些傳統爬蟲的噩夢。代價是:它依賴平台 API 與帳號可用性,而不是繞過它們。

來源 · 官方 README · 定位說明

TIP 03

中文社群資料是這套工具的最大紅利

抖音、微博、微信公眾號的資料，一般工具不易直接取得。透過豆包、元寶、通義的原生搜尋可直接存取，對中文市場研究有具體幫助。

來源 · 官方 README · 內容生態

TIP 04

用 agents/openai.yaml 做隱式呼叫

把 agents/openai.yaml 設好顯示名稱與描述,Agent 就能在 workflow 裡自動觸發 AI Search Hub,不必每次手敲 run_web_chat.py 參數。這是接進自動化流程的關鍵設定。

來源 · 官方 README · Configuration

TIP 05

第一次跑會等你登入,之後才能無人值守

腳本會開 Chrome debug session 等你登入該平台。先把每個要用的平台手動登入過一輪,後續 Agent 隱式呼叫才不會卡在登入畫面。

來源 · 官方 README · Configuration

TIP 06

要加平台,改 ROUTING.md 就好

新增平台或調整路由邏輯,依 ROUTING.md 的擴充指引處理:依問題型態與資料生態定義規則。Perplexity 與 Claude 已被標為未來支援,擴充模式是現成的。

來源 · 官方 README · ROUTING.md

實戰範例

同一主題，分送三個平台取得不同來源的資料。

以「新疆旅遊」市場研究為例，需要旅遊路線、即時社群討論、影音趨勢三類資料。以下示範如何以 run_web_chat.py 依資料型態分別送往豆包、Grok、MiniMax，再將三份輸出收入同一個 workflow。指令與輸出特性依 README 範例。

AI-Search-Hub · python3 scripts/run_web_chat.py

# 1 旅遊路線 → 中文主場,打豆包 $ python3 scripts/run_web_chat.py --site doubao \ --prompt "新疆旅遊路線" --output out/route.txt

[opening chrome debug session · session reused ✓] [doubao native search → extracting structured answer] → out/route.txt 多日行程:天池 → 喀納斯 → 賽里木湖,含分段停點

# 2 即時討論 → X 即時,打 Grok $ python3 scripts/run_web_chat.py --site grok \ --prompt "新疆旅遊最近討論" --output out/social.txt

[grok → real-time X posts] → out/social.txt 依日期排序的貼文 + 連結,反映近期旅遊熱度與爭議

# 3 影音趨勢 → 榜單,打 MiniMax $ python3 scripts/run_web_chat.py --site minimax \ --prompt "新疆旅遊 Bilibili 熱門" --output out/video.txt

[minimax → ranking-based aggregation] → out/video.txt 遊戲 / 戶外 / 生活分類排行,擷取熱門影音清單

[agent workflow consumes out/*.txt as unified context] 一個主題 · 三種生態 · 一份整合脈絡 — 無需任何爬蟲

同一主題，三個平台、三種資料生態。無需撰寫爬蟲，無需處理驗證碼。

— 多平台分送，輸出收入同一份 workflow 脈絡

流程說明

同一個 Python 入口，只切換 --site，即可跨越三個各自需要不同抓取方案的資料生態。豆包回傳結構化路線、Grok 提供即時社群貼文、MiniMax 提供影音榜單。傳統做法需要三套爬蟲、三組登入維護、三種反爬對策。

三份輸出落在 out/*.txt，Agent 直接作為統一脈絡消費。本工具讓你維護的是查詢與路由邏輯，而非底層抓取基礎設施。

使用前須知

工具限制與設計取捨說明。

依賴平台官方介面，非自建爬蟲。AI-Search-Hub 走各平台官方對話介面。平台一旦改版、更新前端或加強風控，流程可能中斷。本工具以「依賴大廠介面穩定度」取代「自行維護抓取邏輯」，這是設計取捨，非缺陷。
第一次跑一定要先登入。豆包、元寶、通義、Kimi、混元這些平台多半需要帳號登入後才能正常對話。首次執行會開出瀏覽器要你完成登入,session 才會被保存重用。沒帳號或沒登入,查詢會直接落空。
它真的會開一個瀏覽器。底層靠瀏覽器自動化驅動平台網頁,跑起來會佔記憶體與 CPU,headless / server 環境要自行確認瀏覽器相依安裝齊全,否則啟動就失敗。
平台有區域與帳號邊界。豆包、元寶、通義、混元、Kimi 主要面向中國大陸生態,部分平台對地區、手機號、實名有要求;Grok、Gemini 則需要對應的海外帳號與額度。能不能查到,先取決於你這個帳號在那個平台是否被允許。
速率與風控是真的。短時間連續打同一個平台會觸發驗證碼或暫時封鎖。它沒有幫你繞過風控的義務,把它當「替你開分頁問問題」的助手,而不是高頻批量抓取機器。
查詢品質仍然要你負責。它只負責把你的 query 送進對的平台,送進去之後答得好不好,取決於你問題本身寫得夠不夠清楚。換平台不會自動修好一個模糊的問題。
支援清單會變,別硬背。README 標示有些平台是規劃中 / 未來支援(如部分海外模型),實際以倉庫當下的 ROUTING 與 agents 設定為準。把「現在支援哪幾家」當成會變動的事實去查,而不是寫死在你的流程裡。
MIT 授權開源專案，無 SLA 保證。本工具無提供客服或服務等級承諾。需要穩定可商用的版本，須自行評估維運或尋找商業方案。請勿將開源 repo 當作具備線上保證的 API 端點使用。

進階路徑

將 AI Search Hub 接入 Agent 作為搜尋層。

AI-Search-Hub 的實用性在於它是可被其他系統消費的一層：查詢送入、純文字輸出、落到 out/*.txt。接上 Agent 後，即可得到一個跨 8+ 平台、無需自行維護爬蟲的即時情報來源。

進階玩法地圖

1. 讓 Agent 隱式調用。repo 內建 agents/ 設定(如 agents/openai.yaml),把搜尋包成工具給 Agent。使用者問一句話,Agent 自己決定要不要打哪個平台,結果直接回流到對話脈絡。

2. 調整路由規則。查詢該落到哪個生態,是由 ROUTING.md 描述的策略決定。想讓「即時社群類」優先走 Grok、「中文影音榜單」優先走 MiniMax,就改這份路由,不用動程式碼。

3. 把輸出當資料管線的源頭。out/*.txt 是穩定的純文字介面。接一個彙整步驟,把多平台答案去重、比對、做成日報或競品監控,就是一條最小可用的情報管線。

4. 擴充平台。需要的平台不在預設清單裡時,順著 ROUTING.md 與 agents/ 既有結構新增一條,讓它成為你私有的搜尋聚合層,而不是依賴上游什麼時候支援。

5. 固定登入 session。把首次登入保存下來的瀏覽器 session 妥善保留,排程任務才能無人值守地重用,不會每次都卡在登入畫面。

最該讀的三份延伸閱讀

① README.en.md：英文版總覽，涵蓋支援平台、定位與商業版差異。
② ROUTING.md：查詢路由策略，說明如何將查詢分派至不同生態，擴充平台前應先閱讀。
③ SKILL.md：搜尋能力接入 Agent 的技能定義與調用方式。

單一查詢送進 8+ 個 AI 平台的原生搜尋。你維護的是查詢與路由，不是爬蟲基礎設施。

— AI-Search-Hub，定位摘要