實戰手冊 · Field Manual 2026 春季號
github.com/minsight-ai-info/AI-Search-Hub · 1.1k ★
S
第 01 期 · 開源工具 / AI 搜尋 / Agent

AI Search Hub:單一介面整合 8+ 個 AI 平台原生搜尋

AI Search Hub 是一套開源 skill,把 Gemini、Grok、豆包、元寶、LongCat、通義千問、MiniMax、Kimi 的原生搜尋與資料抽取整合成單一介面。一個查詢同時送進多個平台,無需為每個來源維護爬蟲、瀏覽器自動化或登入流程。

1.1k
GitHub Stars
8+
支援平台
Python
100% 原生實作
MIT
永久免費授權
01
工具定位

借用各大廠的原生搜尋,而非自行維護爬蟲。

要取得微信公眾號、抖音、微博、X 的即時資料,傳統做法是為每個平台撰寫爬蟲、維護瀏覽器自動化、處理登入與驗證碼。AI Search Hub 採用不同路徑:這些大廠的 AI 助手(豆包、元寶、Kimi、Grok…)本身具備原生搜尋與資料抽取能力,本工具直接借用它們的搜尋介面,而不是另行建置一套抓取系統。

專案定位明確:它不繞過平台,而是站在平台官方搜尋之上。將 Gemini、Grok、豆包、元寶、LongCat、通義千問、MiniMax、Kimi 八個平台的搜尋能力整合成統一介面。一個查詢送入後,路由到合適的平台,各平台以自己的生態回答,結果收斂成 Agent / workflow 可直接消費的格式。

核心入口是 Python 腳本 scripts/run_web_chat.py,搭配 ROUTING.md 決定哪類問題指向哪個平台,agents/openai.yaml 則提供 Agent 隱式呼叫設定。設計目標是以大廠原生搜尋框架取代自建爬蟲,覆蓋 Google、X 即時、抖音/微博趨勢、微信公眾號等一般難以直接抓取的內容。

AI Search Hub · 單查詢多平台流程
一個查詢 ROUTING 選平台 平台原生搜尋 統一輸出 Agent 消費
AI Search Hub 把各大廠的原生搜尋接進 Agent,無需自建抓取層。
— AI Search Hub README · 專案定位
02
安裝與第一次查詢

Python 腳本向指定平台送出查詢。

環境需求:Python 3、Chrome 瀏覽器(供自動化使用)、以及目標平台帳號。clone 後,所有查詢透過 scripts/run_web_chat.py 執行,以 --site 指定平台、--prompt 傳入查詢、--output 指定輸出檔案路徑。

git clone https://github.com/minsight-ai-info/AI-Search-Hub.git cd AI-Search-Hub # 一個查詢打進指定平台 python3 scripts/run_web_chat.py \ --site [platform] \ --prompt "[query]" \ --output [filepath]

實際跑一次:用豆包查新疆旅遊路線

第一次跑某個平台時,腳本會開一個 Chrome debug session 等你登入該平台;登入過後即可正常呼叫。下面是 README 給的範例:

python3 scripts/run_web_chat.py --site doubao \ --prompt "新疆旅遊路線" \ --output out/result.txt
給 Agent 用:隱式呼叫。agents/openai.yaml 是 Agent 介面設定範例,定義顯示名稱、描述,以及 Chrome debug 啟動與等待登入的行為。配置好之後,Agent 可以在 workflow 裡隱式觸發 AI Search Hub,而不必每次手敲腳本參數。
03
支援平台總覽

八個平台,各有不同的搜尋生態與資料覆蓋範圍。

八個平台各有不同的資料生態:部分擅長即時社群、部分覆蓋中文趨勢、部分接入 Google 網頁結果。以 --site 選擇正確平台,即選定了對應的內容來源。Perplexity 與 Claude 已標註為計畫支援項目。

即時社群 · 01
--site grok
X 即時脈動
借 Grok 拿 X/Twitter 的即時貼文。README 範例查 Elon Musk 近況,輸出依日期排序、附連結,含 Starlink、SpaceX、xAI 等主題。
Google 網頁 · 02
--site gemini
Google 網頁結果
借 Gemini 取用 Google 的網頁搜尋生態,適合需要廣泛 web 來源、英文與國際內容的查詢。
中文生態 · 03
--site doubao
豆包 中文主場
字節跳動的豆包,中文趨勢與抖音生態的強項。README 範例查「新疆旅遊路線」,回多日行程、含天池/喀納斯/賽里木湖。
中文生態 · 04
--site yuanbao
元寶 微信生態
騰訊元寶,擅長微信公眾號與騰訊系內容。這類資料傳統爬蟲不易取得,透過平台原生搜尋可直接存取。
影音榜單 · 05
--site minimax
MiniMax 影音趨勢
README 範例查 Bilibili 熱門影片,聚合遊戲、戶外、生活等分類的排行結果,適合影音內容趨勢盤點。
長文問答 · 06
--site kimi
Kimi 長文檢索
月之暗面 Kimi,長上下文與資料整理見長,適合需要把多來源整理成結構化長答的查詢。
綜合中文 · 07
--site tongyi
通義千問 綜合
阿里通義千問,涵蓋廣泛中文知識與電商/阿里系生態,做中文綜合查詢的另一條主線。
輕量快查 · 08
--site longcat
LongCat 快查
LongCat 作為支援平台之一,用於擴充查詢來源的覆蓋面。實際強項依平台當前能力為準。

問題型態 → 該打哪個生態?

這是 ROUTING.md 的核心:依問題型態與目標資料生態選平台。以下對應依 README 所述的內容覆蓋與範例整理,實際路由規則以 ROUTING.md 為準。

你想找什麼 資料生態 建議平台
即時社群動態、人物近況 X / Twitter 即時 grok
國際網頁、英文資料 Google 網頁結果 gemini
中文趨勢、抖音/微博熱點 中文社群趨勢 doubao · tongyi
微信公眾號內容 騰訊 / 微信生態 yuanbao
影音榜單、Bilibili 熱門 影音內容趨勢 minimax
04
操作要點 · 來自 README / docs

查詢品質取決於路由選擇是否正確。

以下操作要點全部來自 README 與專案文件。核心問題是:同一個問題應送往哪個平台。依 ROUTING.md 的策略選對生態,是取得有效結果的前提。

TIP 01

選對平台,比優化關鍵字更關鍵

依 README 說明,關鍵字優化仍有必要,但比傳統做法省力。決定結果品質的關鍵是 --site 選對生態。查 X 即時用 grok、查微信公眾號用 yuanbao。平台選錯,關鍵字再精確也無法取得正確資料。

來源 · 官方 README · Limitations
TIP 02

它不是爬蟲,所以沒有破驗證碼問題

因為站在平台官方搜尋之上,你不需要處理 CAPTCHA、反爬、IP 封鎖這些傳統爬蟲的噩夢。代價是:它依賴平台 API 與帳號可用性,而不是繞過它們。

來源 · 官方 README · 定位說明
TIP 03

中文社群資料是這套工具的最大紅利

抖音、微博、微信公眾號的資料,一般工具不易直接取得。透過豆包、元寶、通義的原生搜尋可直接存取,對中文市場研究有具體幫助。

來源 · 官方 README · 內容生態
TIP 04

用 agents/openai.yaml 做隱式呼叫

agents/openai.yaml 設好顯示名稱與描述,Agent 就能在 workflow 裡自動觸發 AI Search Hub,不必每次手敲 run_web_chat.py 參數。這是接進自動化流程的關鍵設定。

來源 · 官方 README · Configuration
TIP 05

第一次跑會等你登入,之後才能無人值守

腳本會開 Chrome debug session 等你登入該平台。先把每個要用的平台手動登入過一輪,後續 Agent 隱式呼叫才不會卡在登入畫面。

來源 · 官方 README · Configuration
TIP 06

要加平台,改 ROUTING.md 就好

新增平台或調整路由邏輯,依 ROUTING.md 的擴充指引處理:依問題型態與資料生態定義規則。Perplexity 與 Claude 已被標為未來支援,擴充模式是現成的。

來源 · 官方 README · ROUTING.md
05
實戰範例

同一主題,分送三個平台取得不同來源的資料。

以「新疆旅遊」市場研究為例,需要旅遊路線、即時社群討論、影音趨勢三類資料。以下示範如何以 run_web_chat.py 依資料型態分別送往豆包、Grok、MiniMax,再將三份輸出收入同一個 workflow。指令與輸出特性依 README 範例。

AI-Search-Hub · python3 scripts/run_web_chat.py
# 1 旅遊路線 → 中文主場,打豆包 $ python3 scripts/run_web_chat.py --site doubao \ --prompt "新疆旅遊路線" --output out/route.txt
[opening chrome debug session · session reused ✓] [doubao native search → extracting structured answer] → out/route.txt 多日行程:天池 → 喀納斯 → 賽里木湖,含分段停點
# 2 即時討論 → X 即時,打 Grok $ python3 scripts/run_web_chat.py --site grok \ --prompt "新疆旅遊 最近討論" --output out/social.txt
[grok → real-time X posts] → out/social.txt 依日期排序的貼文 + 連結,反映近期旅遊熱度與爭議
# 3 影音趨勢 → 榜單,打 MiniMax $ python3 scripts/run_web_chat.py --site minimax \ --prompt "新疆旅遊 Bilibili 熱門" --output out/video.txt
[minimax → ranking-based aggregation] → out/video.txt 遊戲 / 戶外 / 生活分類排行,擷取熱門影音清單
[agent workflow consumes out/*.txt as unified context] 一個主題 · 三種生態 · 一份整合脈絡 — 無需任何爬蟲
同一主題,三個平台、三種資料生態。無需撰寫爬蟲,無需處理驗證碼。
— 多平台分送,輸出收入同一份 workflow 脈絡

流程說明

同一個 Python 入口,只切換 --site,即可跨越三個各自需要不同抓取方案的資料生態。豆包回傳結構化路線、Grok 提供即時社群貼文、MiniMax 提供影音榜單。傳統做法需要三套爬蟲、三組登入維護、三種反爬對策。

三份輸出落在 out/*.txt,Agent 直接作為統一脈絡消費。本工具讓你維護的是查詢與路由邏輯,而非底層抓取基礎設施。

06
使用前須知

工具限制與設計取捨說明。

  • 依賴平台官方介面,非自建爬蟲。AI-Search-Hub 走各平台官方對話介面。平台一旦改版、更新前端或加強風控,流程可能中斷。本工具以「依賴大廠介面穩定度」取代「自行維護抓取邏輯」,這是設計取捨,非缺陷。
  • 第一次跑一定要先登入。豆包、元寶、通義、Kimi、混元這些平台多半需要帳號登入後才能正常對話。首次執行會開出瀏覽器要你完成登入,session 才會被保存重用。沒帳號或沒登入,查詢會直接落空。
  • 它真的會開一個瀏覽器。底層靠瀏覽器自動化驅動平台網頁,跑起來會佔記憶體與 CPU,headless / server 環境要自行確認瀏覽器相依安裝齊全,否則啟動就失敗。
  • 平台有區域與帳號邊界。豆包、元寶、通義、混元、Kimi 主要面向中國大陸生態,部分平台對地區、手機號、實名有要求;Grok、Gemini 則需要對應的海外帳號與額度。能不能查到,先取決於你這個帳號在那個平台是否被允許。
  • 速率與風控是真的。短時間連續打同一個平台會觸發驗證碼或暫時封鎖。它沒有幫你繞過風控的義務,把它當「替你開分頁問問題」的助手,而不是高頻批量抓取機器。
  • 查詢品質仍然要你負責。它只負責把你的 query 送進對的平台,送進去之後答得好不好,取決於你問題本身寫得夠不夠清楚。換平台不會自動修好一個模糊的問題。
  • 支援清單會變,別硬背。README 標示有些平台是規劃中 / 未來支援(如部分海外模型),實際以倉庫當下的 ROUTING 與 agents 設定為準。把「現在支援哪幾家」當成會變動的事實去查,而不是寫死在你的流程裡。
  • MIT 授權開源專案,無 SLA 保證。本工具無提供客服或服務等級承諾。需要穩定可商用的版本,須自行評估維運或尋找商業方案。請勿將開源 repo 當作具備線上保證的 API 端點使用。
07
進階路徑

將 AI Search Hub 接入 Agent 作為搜尋層

AI-Search-Hub 的實用性在於它是可被其他系統消費的一層:查詢送入、純文字輸出、落到 out/*.txt。接上 Agent 後,即可得到一個跨 8+ 平台、無需自行維護爬蟲的即時情報來源。

進階玩法地圖

1. 讓 Agent 隱式調用。repo 內建 agents/ 設定(如 agents/openai.yaml),把搜尋包成工具給 Agent。使用者問一句話,Agent 自己決定要不要打哪個平台,結果直接回流到對話脈絡。

2. 調整路由規則。查詢該落到哪個生態,是由 ROUTING.md 描述的策略決定。想讓「即時社群類」優先走 Grok、「中文影音榜單」優先走 MiniMax,就改這份路由,不用動程式碼。

3. 把輸出當資料管線的源頭。out/*.txt 是穩定的純文字介面。接一個彙整步驟,把多平台答案去重、比對、做成日報或競品監控,就是一條最小可用的情報管線。

4. 擴充平台。需要的平台不在預設清單裡時,順著 ROUTING.mdagents/ 既有結構新增一條,讓它成為你私有的搜尋聚合層,而不是依賴上游什麼時候支援。

5. 固定登入 session。把首次登入保存下來的瀏覽器 session 妥善保留,排程任務才能無人值守地重用,不會每次都卡在登入畫面。

最該讀的三份延伸閱讀

README.en.md:英文版總覽,涵蓋支援平台、定位與商業版差異。
ROUTING.md:查詢路由策略,說明如何將查詢分派至不同生態,擴充平台前應先閱讀。
SKILL.md:搜尋能力接入 Agent 的技能定義與調用方式。

單一查詢送進 8+ 個 AI 平台的原生搜尋。你維護的是查詢與路由,不是爬蟲基礎設施。
— AI-Search-Hub,定位摘要