三天前的下午,我跑了一個事實查證任務——寫貼文前要確認 Voyage 的 200M 免費 tokens 是不是真的 "永久"。我問 Claude Code,它用 Web Search 給我一段不錯的摘要,但我點不到原始來源。換 Gemini grounding 同一題,他直接回我 8 個 raw URL list 跟引用片段,我可以一個個點開驗證。
就一個小動作,整個工作流的可信度上來了。
這幾天我把研究 (Research) 工作流拆開、配成一支特化軍團——其中包含繼串接了 Codex 後又一個 LLM 巨頭:Gemini CLI。下面是完整思路、為什麼這樣分工、跟一份起手包讓你照做。
沿革:Claude × Codex 之後的下一步
過去兩篇我寫了把 Claude Code 跟 Codex CLI 串起來、做雙 AI 工作流——Codex 補生圖跟 adversarial review、Claude Code 中央指揮。整套工作流跑出 Post 17 機器人馬拉松 的 9 張 carousel,後來也寫了 雙 AI 起手包 把整套接法寫成 paste-to-AI 模板。
這篇是接著的下一步——改造研究 (Research) 工作流。
為什麼挑研究當下一個改造目標?因為研究是一切的起源。蒐集資料就歪掉,後續產品搭建、文章、報告⋯一切都會跟著歪。地板與天花板都看研究。改造這一塊,後面所有產出都跟著升級。
Claude Code 原生 baseline 七七八八
先誠實面對 baseline——Claude Code 原生其實已經很強。它有:
- Web Search:後端用 Brave Search(不是 Google/Bing),回 page titles + URLs。2026 還加了 dynamic filtering,先 filter 結果再進 context、省 token。
- Web Fetch:抓單個 URL 的內容回來解讀。
- 新版瀏覽器(Computer Use):Pro/Max 訂閱有,能控制 Chrome、跑互動式爬取(登入、點擊、跨頁)。
- MCP 接入無數第三方:包括 Google Workspace 官方 connector,能接 Drive / Gmail。
如果你用 Claude Code 寫文、查事實、找參考,它真的不需要外掛——大部分 case 它自己就解決了。
但全丟給它跑會慢慢浮出三件事。

三維度撞牆:為什麼一支特化軍團贏通用工具
維度一:Token 成本
每次 search、每次抓網頁,結果都會塞進你跟 AI 對話的「記憶體配額」(也就是 token,AI 看得到的文字總長度)。
高頻的研究任務——撞題比對、競品調研、寫稿前事實查證——一篇深度跑下來,光是把搜尋結果灌進對話就吃掉幾萬個 token。配上 5 分鐘的快取機制,過期了又得重燒。整體上下文在兩到三輪對話內很快就到臨界點。
把 search 推到外部小工具(wrapper subprocess)去跑、只回最精簡的 JSON 給主對話,整體 token 燒得少很多。同樣 $20 訂閱,實際能跑的研究次數可以再多兩三倍,開啟新對話的頻率下降,對話品質也同步上升。
維度二:搜尋引擎選擇(Brave ≠ Google)
Claude Code 的 Web Search 後端用的是 Brave,不是 Google。
要拿 Google 即時索引那邊看到的結果——SEO 角度看誰寫過、誰排第一、競品調研、寫稿前查證——換 Gemini 的 grounding search(連 Google 索引的搜尋工具)會給你 raw URL 跟引用片段。寫稿前的查證精度提升很有感。
我寫貼文時實際比過幾次同題,Brave 跟 Google 看到的 ranking 真的不一樣。需要 SEO 角度的場景,這是顯著差距。
維度三:覆蓋面(X/短影音/撞題比對通用工具摸不到)
有些缺口原生 baseline 永遠摸不到。讓我用實際場景帶過:
- 撞題比對:跨自己 200 篇歷史貼文做相似度比對找撞題。Voyage 提供 embedding + rerank(embedding 是把文字變成一串數字、能算兩段文字有多像;rerank 是把搜尋結果重新洗牌、最相關的排前面),200M tokens 永久免費,普通人幾乎用不完。讓我能秒比歷史撞題、再不會無意間出兩篇主題重複的內容。
- X/Twitter 上某個 KOL 最近講什麼:Grok 的 x_search tool 能撈引用片段,原生 baseline 完全摸不到。
- JS 動態網站、SPA、要載入完才有內容的頁面:Firecrawl 比通用 fetch 拿得乾淨。
- YouTube/IG Reels/TikTok 內容:yt-dlp 加上 transcript(字幕)跟視覺理解 plugin 才解得開。
這些都不是 Claude Code「不會做」,而是「能做但通用工具不夠精」。
Why Gemini CLI not just Google Search API
讀到這裡你可能會想:「如果重點是 Google search,為什麼不直接 call Google Search API 就好?為什麼要把整顆 Gemini CLI 接進來?」
好問題。純做搜尋升級的話,直接 call Google Search API 確實就夠了——拿到 raw URL、做完 query 就結束。
但這次特意接 CLI(也就是把 Gemini 整個模型都接進工作流,不只當搜尋工具)是為了再下一步做準備。
我已經有 Claude Code 當主要協作的 AI、加了 Codex 補生圖跟找碴 review。這次接 Gemini CLI(背後是 Google 的 Gemini 模型,可以呼叫 Google 整套服務 Drive/Gmail/Calendar/Docs)作為「又一位 LLM 巨頭隊友」。
未來不管要動 Google Workspace、做長 PDF 多模態理解、跑超長 context 任務,有一個獨立的 LLM 隊伍站在我這邊,彼此能 delegate(互相轉派任務),組合出來的能力加成會比單顆 LLM,或只是同時訂三個服務分開用,效率高上非常多。
純 API 是「叫它做一件事拿結果就走」,CLI 是「整顆模型來當你工作流的一份子」。差別就在這。

我配的軍團——免費 tier 全圖
整套軍團拆開來看,每一層各自有特化工具、各自有免費或超便宜的 tier:
- Google grounding:Gemini CLI/API。OAuth 1,500 req/day、API 500 grounding/day。拿 Google 即時索引 raw URL、SEO 查證。
- Workspace 整合:Gemini CLI workspace extension。OAuth 內無限。Drive 翻檔、Gmail 摘要、Calendar 對齊。
- Embedding/Rerank:Voyage AI rerank-2.5 + voyage-4。200M tokens 永久免費。撞題比對、語意相似度。
- 通用 web search:Tavily MCP。1,000 calls/月。一般 web research。
- 動態網站抓取:Firecrawl MCP。500 credits/月。JS/SPA/要 render。
- X/Twitter data:xAI Grok API + x_search。在 console.x.ai 儲 5 美金 opt-in data-sharing 後,每月有大額免費 credit。KOL 追蹤、X 上話題。
- 短影音字幕:youtube-transcript MCP。無限。YouTube/Shorts。
- 短影音內容理解:claude-video-vision plugin + yt-dlp + ffmpeg。無限。IG Reels/TikTok/YouTube。
整套免費或超便宜的 tier 加起來,月成本接近零(看你需不需要 Grok 那層)。比起單純只訂 ChatGPT Plus + Claude Max,每月多花的錢是個位數美金,能力卻翻倍。
一張分工 cheatsheet 寫進 CLAUDE.md
工具裝完只是第一步。重點是讓 Claude Code 自己知道何時叫哪個工具——這條路徑寫一張 cheatsheet 進 ~/.claude/CLAUDE.md,下次它就會自己 routing:
- Google 即時索引 raw URL(SEO/競品/寫稿查證)→ Gemini grounding
- Workspace 整合(Drive/Gmail/Calendar 翻檔)→ Gemini CLI Workspace extension
- 長 PDF/多模態理解 → Gemini Flash
- 撞題比對/語意相似度(跨自己歷史內容)→ Voyage embedding/rerank
- 通用 web search → Tavily MCP
- JS 動態網站/SPA 抓取 → Firecrawl
- X/Twitter 上 KOL 講什麼 → Grok x_search
- YouTube/IG Reels/TikTok 內容 → yt-dlp + claude-video-vision
- 快速 sanity check → Claude Code 原生 Web Search
完整版(含每個工具的 paste-to-AI prompt、5 分鐘上手)我寫在文章下方下載資源裡。

Sequoia AI Ascent 2025 — 為什麼這條路重要
這條改造路其實對齊去年我看的一個重要 framework。
Sequoia AI Ascent 是矽谷頂級創投 Sequoia Capital 每年辦的 AI 年度大會,集結 AI 圈最頂尖的投資人、創辦人跟研究者一起講趨勢,是業界看 AI 接下來會怎麼走的重要來源。
去年(2025-05)的核心觀察是這樣畫一條線:
個人 AI 助手 → agent swarms(一群 AI 協作的團隊)→ agent economy(AI 團隊之間的協作)
中間最大的 mindset 翻轉:
從「我自己跑一個確定的 task」 → 變成「我管理一群可能性的分布」(manage distribution)
未來 builders 不是只會寫程式的人,而是 orchestrate(指揮派工)一支 AI 隊伍、決定誰做什麼的人。
我現在把 Gemini CLI 接進來,就是讓我的隊伍從兩位(Claude + Codex)擴成三位、再下一步可以更多(NotebookLM/Veo/Anthropic Deep Research API)。
順道一提,2026 的 AI Ascent 也剛結束,有一些發展驗證跟去年那條線不謀而合,之後有空再寫一篇分享心得。
但這套不是每個人都要立刻搭
偶爾用 AI 寫個草稿、心智負擔已經剛好——那繼續用 Claude Code 原生功能 + MCP + Skills 也已經很 OK,不一定要折騰外部工具。
會想搭的人,是已經感覺到「我的 AI 能再多做一點什麼」、想要更精的搜尋、更廣的覆蓋面、跟為長線 AI 隊伍鋪路的那群。這樣的人,絕對值得花一個下午把這套研究團隊串接起來。
結語
Anthropic 之後對齊多家 AI 跨家通訊協議後,這條路會更穩。屆時我會再寫一篇給你看。
文章下方有完整起手包可以下載——含每個工具的 paste-to-AI prompt、5 分鐘上手、跟我自己怎麼想分工。
幫你成為自己 AI 團隊的主理人。
— N

