5 分鐘把 Claude Code 跟 Codex 串起來：雙 AI 協作起手包

三天前的下午，我做完一張 carousel 配圖。流程是這樣的：跟 Claude Code 對話、它幫我呼叫 Gemini API 生插圖、然後接力做 HTML 模板搭建、把生出來的插圖塞進模板、最後用 Playwright 截圖收尾。

聽起來工序很多，其實工序不是最痛的。最痛的是中間「插圖塞進 HTML 模板」這一段——位置不對、大小不對、跟旁邊的表格佈局拍起來怪怪的，我跟 Claude 來回調整好幾次。發一篇文加上這些調整，3 到 4 個小時跑不掉。

這套作法已經比早期的工作流順很多，我前幾篇 Post 都在教這個方式。但那天下午我心裡有個念頭：應該還可以更順一點。

三天後的晚上，我把同一份視覺需求改丟給 Codex CLI，下了一條命令就出門吃飯。回來打開資料夾，9 張全好，連 sips 量比例、超容差自己重生這些事 Codex 都做完了。我看著資料夾愣了三秒——不是因為快，是意識到：我這陣子把 Claude 跟 Codex 當競品在比，根本沒去想它們可能是隊友。

這篇就是把那三天我在做什麼、踩到什麼、最後收斂出什麼樣的工作流，完整寫一次給你。文末附一份起手包，整段貼給你的 AI 它就會接著帶你跑。

一個誠實的開場

我得先老實講一件事。我跟 Codex 的合作其實才剛開始一個月——這個月之前，我只用 ChatGPT 網頁版，不太碰 Codex CLI。轉折點是 OpenAI 重新訂閱送了我一個月 Plus，我那時順便去研究 Codex CLI 在訂閱裡能做什麼，才意外發現它可以接成 Claude Code 的 sub-agent。

所以這篇講的不是「我跑了一年的成熟工作流」，而是「我這個月還在摸索、但已經明顯感覺效率變好」的觀察筆記。我也還在學習這套作法。

但即使只跑了一個月，效率提升的差距大到讓我覺得值得寫一篇分享。下面就是我的觀察。

為什麼一個人值得同時養兩家 AI

一開始我也覺得「同時訂 Claude Max $200 + ChatGPT Plus $20」是雙重花費，每個月看到帳單心會抽一下。

但這個月我去看 Codex CLI 能做什麼之後才發現，原本我以為 ChatGPT Plus 我只是用網頁版聊天，結果 Codex CLI 在 Plus 訂閱內就能跑、不用切到 API 計費，9 張 carousel 跑完只是吃我訂閱配額的一小角，根本沒額外帳單。同一時間 Anthropic 推 Claude Skills 跟 Routines，把長期記憶跟工作流變一等公民——兩家方向開始互補而不是競爭。

我那時候的心情是這樣的：原來我每月多付的那 $20，不是浪費，是另一隻手。

但「把兩家串起來」聽起來很玄，到底要怎麼串？這就要先理解一件事——它們其實在語法上比你想像的更接近。

一份 markdown，兩家都讀

我為了搞清楚怎麼串，踩了幾次「兩邊認知不一致」的坑——我跟 Claude Code 講好的規則，Codex 接手時完全不知道，結果生出來的東西跟我預期差很遠。

收斂了一輪之後，我落腳在這個 4 層結構：

頂層規格層（共用）：一份 slide-plan.md 寫 9 張 carousel 的規格——kicker、H1、強調色、mascot 姿勢、禁用詞，全部 token level 寫死。
規則層：CLAUDE.md 給 Claude Code 讀，AGENTS.md 給 Codex 讀。兩個檔在語法上幾乎相同，都是 Markdown，差別只在開頭的 identity 段落。
Skill / 工具層：Claude 端有 ~/.claude/skills/，Codex 端有 plugin 跟 agent skill。各自有的能力，但讀同一份規格。
圖像引擎層：底層是 GPT Image-2 跟 Gemini API，由 Codex 或 Claude 視場景呼叫。

這個結構的好處是：我寫一次規格，兩家盲點不一樣、剛好互補。Claude 漏掉的細節 Codex 會抓到，反過來也是。

聽起來抽象，但實作其實只要三條命令。

5 分鐘 setup：三條真實命令

如果你已經在用 Claude Code，加 Codex CLI 接成 sub-agent 不是另外裝一套工具，是在 Claude Code 裡面跑：

# 1. 加 Codex 的 plugin marketplace 來源
/plugin marketplace add openai/codex-plugin-cc

# 2. 安裝 Codex 主 plugin
/plugin install codex@openai-codex

# 3. 跑 Codex 的初始 setup（會檢查 Codex CLI 是否裝好、走完登入）
/codex:setup

跑完之後，Claude Code 視窗就能直接呼叫 Codex 當 sub-agent。對我這種日常主要在 Claude Code 工作的人來說，體感是「Claude 一直是 Claude，但會自動派工」。

實際用起來大概像這樣。我直接打：

幫我用 Codex 跑這個 review，找出我漏抓的細節。

Claude 會自己走 codex:rescue 或 codex:adversarial-review，把任務丟給 Codex CLI，收回結果整合進回應。我不用切視窗、不用複製貼上，整個流程就在同一個對話裡完成。

但裝完之後，真正讓兩家越用越順的，不是這三條命令，是一個習慣。

讓 AI 累積經驗的習慣

剛開始用 Claude Code 那段時間，我每天都在重複貼同樣的 prompt 給它。「我要做 carousel、規格是 4:5、標題用橘色 #D4623B、不要動物 mascot⋯」一天貼五次，連我自己都覺得自己很笨。

後來我養成一個習慣：每次 AI 做出一個我覺得有用的解法，就請它打包成 skill。例如我會說：

未來要做圖像生成的時候，幫我把目前這套流程打包成 skill。
要包含：
- 哪個工具（Gemini API / Codex Image-2）做哪種場景
- 紅線（4:5 portrait、不用 sips center crop、ratio 容差 ±5%）
- 重試機制（超容差自動 retry 最多 2 次）
- 失敗 escalation 條件
存到 ~/.claude/skills/{合適的命名}/SKILL.md

累積下來，我 ~/.claude/skills/ 底下有 50+ 個 skill。每個都是一次「下次比上次更聰明」的累積。下一篇 carousel 開工的時候，我不用再貼那段 4:5 規格——Claude 自己讀 skill 檔就知道。

這個心法的關鍵字是 lessons learned。每次跑完不是直接收工，是想一下「這次學到什麼下次能用」，然後寫進 skill。Codex 端我也用同樣邏輯處理 plugin 跟 agent skill。

講到這裡都還很抽象。讓我用兩個真實場景把這套作法講清楚——一個寫程式、一個生圖。

場景一：寫程式 — Claude 仔細，Codex 跑量

CatDoes 那個 staff engineer 在 4/23 發了一份 Express.js refactor 的 benchmark。同一個任務，他給兩家 AI 各跑一次：

Claude Code：1 小時 17 分、用了 6.2M token、抓到了一個關鍵的邊角細節（一個 race condition）
Codex CLI：1 小時 41 分、用了 1.5M token、漏掉那個細節

Token 用量差 4 倍多，API 等價成本差 10 倍。Codex 便宜十分之一，但漏抓一個關鍵 bug。

我看到這份 benchmark 的時候第一個反應是：「所以還是 Claude 比較好嘛。」但後來我自己在改一個 auth flow 的時候，跑了同樣的對比實驗——讓 Claude 寫主邏輯，PR 送出前手動觸發 /codex:adversarial-review。Codex 用攻擊者視角跑了一輪，抓到一個我跟 Claude 都漏掉的邊角案例：兩個 session 同時 refresh token 會踩到。

那一刻我才真的懂 CatDoes 的數據在說什麼。它不是在說「貴的比較好」，它在說「貴的抓細節、便宜的跑量」。

這就是我現在的工作流分配：

Claude 規劃 + 寫主邏輯（30% 時間）：架構設計、寫主功能、跨檔案 refactor
Codex 敵對審查（5% 時間）：PR 送出前手動觸發 /codex:adversarial-review，Codex 主動嘗試破壞這段 code、找邊角細節跟 null check 漏的
Claude 接 Codex 的攻擊報告改 code（15% 時間）：知道後面有 attacker，Claude 從一開始就更防禦性
Codex 跑量 — unit test、refactor 重複任務、跨檔案 rename（50% 時間）：給 plan 之後連續執行 30 分鐘以上無人介入

這個分工的核心信念是 Claude 守關鍵、Codex 跑量。但寫程式只是其中一個場景，圖像生成是更顯著的對比。

場景二：圖像 — 從拼接到一條龍

文章開頭講的那個三天前的下午就是這個場景。讓我把那天的工作流攤開給你看。

我的 carousel 通常 9 張一組。過去用 Gemini API 路線是這樣：先讓 Claude Code 呼叫 Gemini API 生插圖、然後我搭 HTML 模板、把插圖塞進模板裡、用 Playwright 跑截圖。痛點不在生圖本身，是中間「塞插圖進模板」這段的視覺微調——這張位置偏左 20px、那張跟下面的表格擠到了、配色跟另一張不一致。9 張下來每張要回頭調個兩三次，整個下午就這樣過了。

整套作法本身已經比更早的工作流順很多，我前幾篇 Post 都在教這套。但每張背後 2-3 次微調 × 9 張，3-4 個小時跑不掉。

三天後改用 Codex CLI 之後，整段流程變成這樣：

cat instruction.txt | codex exec \
  --cd ~/your-project/ \
  --full-auto \
  -i ~/avatar-reference.png \
  -i ~/style-reference.jpg

一條命令、Codex 自己讀規格檔、自己跑 image_gen 9 次、自己量 sips ratio、超容差自己 retry、自己寫 session log。我這邊只看 final 9 張結果。我那天就是按完命令直接出門吃晚餐，回來資料夾整整齊齊。

從拼接到一條龍，差別不只是少幾步，是 Codex 內建了「生完自己驗、不對自己重來」的機制。我不再需要當品管。整個下午的注意力可以拿去做別的事。

不過 Codex CLI 在 Plus 訂閱裡跑也不是無限額度，這就要講到我這個月學到最痛的一課。

關於額度：上禮拜五晚上 11 點的故事

上禮拜五晚上 11 點，我在跑一個 carousel batch、9 張 image_gen。跑到第 6 張突然停了——不是 error 訊息、是 Codex 直接靜默無反應。我那時還沒搞懂機制，以為是 ngrok 或哪裡掛了，又重啟一次、再跑一次、又停。第二天早上才意識到：那不是 bug，是 5 小時 rolling window 滿了，要等重置。

從那次之後我的習慣是：30 分鐘以上的長任務一律睡前丟，白天只跑互動式對話。Claude Max 5 小時 rolling window 跑大型 refactor 一天大概能跑 2 到 3 輪，Codex Image-2 每月有上限、9 張 carousel 大約吃月配額的 1/30。聽起來好像很有空間，真的會擋。

講到 Plus 訂閱順便提一個我意外發現的好康。如果你之前停用過 ChatGPT Plus、最近重新訂閱，會自動送你 1 個月。我重新評估雙 AI 工作流的時候才意外發現的，閒置不用就是丟錢。

還有一件事可能會影響你的決定——OpenAI 在 4 月為 Claude Code 寫了一個官方 plugin，就是上面 setup 用到的 openai/codex-plugin-cc。這個 plugin 在 Hacker News 上被討論了 83K views。OpenAI 主動為 Anthropic 的 IDE 寫整合，等於官方背書「兩家可以協作」。這條路不是 hack。

不為了串接而串接

講到這裡，這篇文章看起來像在勸大家「兩家一定要串接才對」。但我想老實說一件事——其實不是。

串接的真正意義不是「同時用兩家」，而是讓你有空間根據任務交給最適合的 AI。串完之後最重要的不是工具本身，是你開始用「派工」的思維工作——這個 PR 該誰 review、這個 batch 該誰跑、這次生圖該怎麼分配。讓 AI 自己幫你管理任務分配，不是你每次手動切換工具。

但這也代表，如果你現在的工作流已經很順、你覺得 Claude 一家就夠了、或你只用 ChatGPT 也跑得很開心，那就不需要為了串接而串接。把這幾個小時拿去優化其他還在卡你的事，可能更划算。

看自己的成果需要的是什麼。如果你的瓶頸不在「兩家工具來回切換」，串接的價值就有限。但如果你已經在感受到「同樣的設定我又重做了一次」這種摩擦，那這篇講的這套作法可能是對的方向。

我這個月跑下來的節奏

最後分享一下我這個月實際的工作節奏，給你當參考。

早上九點開始，我會先跟 Claude 對話 30 分鐘，把當天要解的問題拆出來——通常是兩三個任務的 plan：哪個檔案要改、預計改幾行、會影響哪些測試。中午前我給 Claude 寫主邏輯，自己邊吃飯邊看它寫。下午兩點之後我把不需要創意的重複工作（unit test、refactor 變數名、跨檔案 rename）打包成 instruction.txt 丟 Codex 跑，那個 batch 通常會跑半小時到一小時，期間我自己處理 PR review、寫文件、開會。傍晚 Codex 跑完我把結果丟回 Claude 收一輪。

老實說這套節奏對我來說也還在優化中。三個禮拜前我才剛把 Codex CLI 接進來、上禮拜五晚上 11 點才知道什麼叫 rolling window 滿了、這個月跑了 18 篇 carousel 才慢慢摸到節奏。但已經明顯感覺到效率提升很多——有些下午我可以同時跑三件事，這在以前不可能。

我也還在學習這套作法。這篇是我這個月觀察到、整理給你的最新版。

如果你也想試試，下面有一份起手包可以下載。

起手包

我把上面講的整套作法整理成一份 markdown，設計給「直接貼給 AI 看」的格式——三步 setup、養 skill 心法的 prompt 範本、寫程式敵對審查範本、圖像 carousel 直生範本，還有額度查表跟雷區避雷。整份是繁中，貼給你的 Claude Code、ChatGPT、Gemini 它讀完就會接著帶你跑。

文章下方有下載卡片，點下去就能拿走。