# 研究軍火庫起手包

> **這份是設計給你的 AI 助手讀的，不是給你讀的。**
> 把整段（或挑你需要的那幾段）貼進你的 Claude Code、ChatGPT、Claude Desktop 或 Cursor 對話框，它會帶你跑完整套設定。**你不需要打開終端機、不需要懂 command、不需要知道什麼是 API key。**
>
> 來自 [@be.ai.curator](https://www.threads.com/@be.ai.curator) 配套資源｜完整故事在 [Blog](https://be-ai-curator.com/blog/research-arsenal-onboarding)

---

## 開始之前——白話 micro 名詞表

第一次接觸這些工具的話，先讀這小段：

- **Claude Code**：Anthropic 出的 AI 助手，可以裝在 VS Code 編輯器、Mac／Windows 桌面 app，跟它聊天的那個對話框就是它。**這份起手包預設你已經有它**。
- **Gemini CLI**：Google 出的命令列 AI 工具，背後是 Gemini 模型，可以接你的 Google 帳號（Drive／Gmail／Calendar），也能直接拿 Google 即時索引的搜尋結果。
- **API key**：一把鑰匙、給工具去敲服務商的門。免費版額度通常夠日常用。
- **grounding（接地）**：AI 回答時引用真實 search 結果、附 source URL，不憑記憶亂講。
- **embedding／rerank**：把文字變成數字、能算「兩段文字有多像」（embedding），再把搜尋結果重新洗牌、最相關的排前面（rerank）。撞題比對、找相似資料的底層工具。
- **CLI／API**：CLI 是「整顆模型來當你工作流的一份子」，API 是「只叫它做一件事拿結果就走」。差別等下講。
- **Quota／額度**：每個工具都有冷卻時間或每日上限，像手遊體力，燒完要等。

---

## 起手包：給你的 AI 看的 SYSTEM 段

複製下面整段，貼進你的 AI 對話框第一句：

```
你是我的研究工作流顧問。我想配一支特化的研究軍火庫——
讓 Claude Code 中央指揮，外接 Gemini CLI 補 grounding 跟 Workspace、
Voyage 補 embedding／rerank、Firecrawl 補動態網站抓取、Grok 補 X 資料、
yt-dlp 加視覺理解解短影音。

我的目標：
1. 帶我裝好需要的工具，盡量走免費 tier。能你自己跑的就自己跑、不要叫我打開終端機。
2. 教 Claude Code 在哪些情境該主動叫哪個外部工具。
3. 我做重複性研究工作的時候，幫我打包成 skill 存起來、下次更順。
4. 跑長任務前提醒我額度。

語氣：直接、簡潔、行動導向、不要廢話。
我不懂 command line。每一步用白話告訴我「現在做什麼、為什麼」。

每給我一個能跑的成果，提議怎麼打包成 skill，
然後問我下一題要從哪裡開始。
```

讀完之後 AI 應該自動進入「研究軍火庫導師」模式。如果它沒有，就直接問：「我們從第幾步開始？」

---

## Part 1 — 裝 Gemini CLI（讓 AI 帶你跑）

複製下面整段，貼給你的 Claude Code：

```
帶我裝 Gemini CLI、綁我的 Google 帳號（如果我有付 Google AI Pro $19.99/月就走 OAuth、否則用免費 API key）、
教你自己何時該叫 Gemini 動工。每一步先跟我確認 work 再進下一步。

第一步：裝 Gemini CLI
  最簡單方式：用 brew install。
  如果我沒裝過 Homebrew，先教我裝（macOS Spotlight 搜「終端機」打開、貼這條：
    /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)")
  裝好之後跑：
    brew install gemini-cli
  驗證：gemini --version 能跑出版本號。

第二步：登入 / 設 API key
  如果我有付 Google AI Pro：走 OAuth、跑 gemini auth login，瀏覽器開來登入我的 Google 帳號。額度上限：1,500 req/day（夠用一輩子）。
  如果我沒付 Pro：去 ai.google.dev 拿免費 API key，存成環境變數 GEMINI_API_KEY。額度：500 grounding/day、夠日常研究。
  問我用哪一條 path、然後幫我跑。

第三步：教你自己何時叫 Gemini
  打開我專案的 CLAUDE.md（沒有就幫我建），加一段：
    「需要 Google 即時索引的 raw URL list（SEO 角度、競品調研、寫稿前查證）→ 主動叫 Gemini grounding。
     需要動我 Google 帳號（Drive 翻檔、Gmail 摘要 thread、Calendar 對齊）→ 叫 Gemini CLI workspace extension。
     需要長 PDF 或多模態理解（我把檔案丟給你）→ Gemini Flash。」
  寫完問我：「下次我說『查一下這週 AI 圈最熱話題、要 source URL』，你會主動叫 Gemini 嗎？」

每一步沒驗證 work 不要進下一步。
```

> 你用的是 ChatGPT 或 Claude Desktop（不是 Claude Code）：把上面「第一步」改說「先帶我用 brew 或 npm 裝 Gemini CLI、你能直接跑就跑、不能跑就教我」，AI 會切換成適合你介面的路徑。

---

## Part 2 — 接 Voyage embedding／rerank（200M tokens 永久免費）

複製下面整段，貼給你的 Claude Code：

```
帶我接 Voyage AI——他們的 embedding（rerank-2.5、voyage-4 系列）給每個帳號 200M tokens 永久免費，
普通人幾乎用不完。這是研究工作流的隱藏底座，撞題比對、語意搜尋都靠它。

第一步：申請 API key
  到 voyageai.com/dashboard 註冊、拿免費 API key（不需要綁信用卡）。
  存進環境變數 VOYAGE_API_KEY。如果我有 ~/NelsenClaw/.env 就寫進去。

第二步：示範一次「跨 200 篇歷史貼文撞題比對」
  我給你一個新題目（一段中文），你幫我：
  1. 把新題目跟我過去 18 篇貼文都做 embedding（Voyage rerank-2.5）
  2. 算 cosine similarity、找出最相似的 3 篇
  3. 報告：紅燈（>0.85，撞題）／黃燈（0.70-0.85，相關但角度不同）／綠燈（<0.70，新題目）
  跑完問我：「這個比對要不要打包成 skill 叫 freshness-gate？下次我提新題目自動跑一次？」

第三步：rerank use case
  我做研究時、search 拿回 10 個結果，幫我用 Voyage rerank 把最相關的排前 3 名。
  範例命令給我看一眼。
```

---

## Part 3 — Tavily／Firecrawl／Grok 的接法（依你需要選擇）

這三條 optional、看你的研究方向。

### Tavily（免費 1,000 calls/月）— 通用 web search 替代

```
裝 Tavily MCP、給我的 Claude Code 用。額度 1,000 calls/月、不需要綁信用卡。
路徑：到 tavily.com 註冊拿 API key、然後跑 claude mcp add tavily 帶 key。
驗證：在 Claude Code 對話框問「用 Tavily 搜這週 AI 圈最熱話題」，應該回 raw URL list。
```

### Firecrawl（免費 500 credits/月）— 動態網站抓取

```
我之前用 firecrawl 抓網頁。他特長是「JavaScript 動態網站、SPA、要載入完才有內容的頁面」，比通用 fetch 拿得乾淨。
裝 firecrawl MCP、API key 從 firecrawl.dev 拿。
驗證：抓一個 SPA 網站當測試。
```

### Grok（$5 unlock 後 $150/月免費）— X 資料專用

```
研究 X／Twitter 上某個話題、某個 KOL 在講什麼、Grok 的 x_search tool 能撈引用片段。
路徑：到 console.x.ai 開 API key、存 $5 unlock data-sharing program、$150/月免費 credits 自動入帳。
注意：兩岸／政治／性別議題 Grok 有偏見、別碰；房地產／科技／AI 中性題目 OK。
驗證：搜「最近 AI 圈某個 KOL」test 看回引用片段。
```

---

## Part 4 — 短影音 pipeline（YouTube／IG Reels／TikTok）

```
研究包含短影音內容時、yt-dlp 加 transcript（字幕）+ claude-video-vision plugin（視覺理解）才解得開。
通用 web 工具完全摸不到。

裝 yt-dlp：
  brew install yt-dlp
  驗證：yt-dlp --version 能跑。

抓字幕：
  yt-dlp --write-auto-subs --sub-langs zh,en --skip-download <影片URL>
  會下載 .vtt 字幕檔。

視覺理解：
  裝 claude-video-vision plugin（Claude Code 內 /plugin install claude-video-vision）。
  把影片檔丟給 Claude Code、它會抽 frame + 用視覺模型解讀。

測試：丟一條 IG Reels／YouTube Shorts URL、看能不能拿到字幕＋視覺摘要。
```

---

## Part 5 — 一張分工 cheatsheet 寫進 ~/.claude/CLAUDE.md

複製下面整段，貼給你的 Claude Code：

```
把下面這張分工 cheatsheet 寫進 ~/.claude/CLAUDE.md（沒有就幫我建一個）：

## 研究軍火庫分工 cheatsheet

| 任務類型 | 主路 | 為什麼 |
|---------|------|-------|
| Google 即時索引 raw URL list（SEO／競品／寫稿查證） | Gemini grounding | Brave 不是 Google |
| Workspace 整合（Drive／Gmail／Calendar 翻檔） | Gemini CLI Workspace extension | OAuth 直連 |
| 長 PDF／多模態理解 | Gemini Flash | 1M context |
| 撞題比對／語意相似度（跨自己歷史內容） | Voyage embedding/rerank | 200M 永久免費 |
| 通用 web search | Tavily MCP | 1,000/月免費 |
| JS 動態網站／SPA 抓取 | Firecrawl | render JS |
| X／Twitter 上 KOL 講什麼 | Grok x_search | 唯一能進 X |
| YouTube／IG Reels／TikTok 內容 | yt-dlp + claude-video-vision | 通用工具摸不到 |
| 快速 sanity check | Claude Code 原生 Web Search | 直接、不需切外部 |

紅線：
- 撞兩岸／政治／性別議題不用 Grok（偏見）
- 員工 PII 不餵 Gemini OAuth（telemetry）
- 我跑研究前先看「這個任務最對的工具是哪個」、不要全丟通用工具

寫完之後幫我跑一個 dry run：給我一個假設題目（例：「2026 Q2 AI 圈三個重要新工具趨勢」）、用 cheatsheet 自己想會調哪幾個工具、我會 review 你的判斷。
```

---

## Part 6 — Vision 短篇：為什麼這套重要

去年 Sequoia AI Ascent 2025 主題演講畫了一條線：

```
個人 AI 助手 → agent swarms（一群 AI 協作的團隊）→ agent economy（AI 團隊之間的協作）
```

中間最大的 mindset 翻轉：從「我自己跑一個確定的 task」 → 變成「我管理一群可能性的分布」(manage distribution)。未來 builders 不是只會寫程式的人、是 orchestrate（指揮派工）一支 AI 隊伍、決定誰做什麼的人。

你現在在做的這件事——把 Gemini CLI 接進 Claude Code、加上 Voyage / Firecrawl / Grok 各層特化工具——就是提前搭好你自己的 agent swarm 雛形。

下一步等 Anthropic 對齊多家 AI 跨家通訊協議、這個團隊會更穩。屆時我會再寫一篇給你看。

—

幫你成為自己 AI 團隊的主理人。

— [@be.ai.curator](https://www.threads.com/@be.ai.curator)
