← 回到 Blog
5 分鐘把 Claude Code 跟 Codex 串起來:雙 AI 協作起手包
AI 工作流·N

5 分鐘把 Claude Code 跟 Codex 串起來:雙 AI 協作起手包

三天前的下午我發完一張 carousel,HTML 模板插圖塞入來回花掉幾小時。三天後同一份視覺需求改丟給 Codex CLI,下一條命令出門吃飯回來就好了。這篇講中間我做了什麼,以及——其實不需要為了串接而串接。

Claude CodeCodexAI 工作流自動化

三天前的下午,我做完一張 carousel 配圖。流程是這樣的:跟 Claude Code 對話、它幫我呼叫 Gemini API 生插圖、然後接力做 HTML 模板搭建、把生出來的插圖塞進模板、最後用 Playwright 截圖收尾。

聽起來工序很多,其實工序不是最痛的。最痛的是中間「插圖塞進 HTML 模板」這一段——位置不對、大小不對、跟旁邊的表格佈局拍起來怪怪的,我跟 Claude 來回調整好幾次。發一篇文加上這些調整,3 到 4 個小時跑不掉。

這套作法已經比早期的工作流順很多,我前幾篇 Post 都在教這個方式。但那天下午我心裡有個念頭:應該還可以更順一點。

三天後的晚上,我把同一份視覺需求改丟給 Codex CLI,下了一條命令就出門吃飯。回來打開資料夾,9 張全好,連 sips 量比例、超容差自己重生這些事 Codex 都做完了。我看著資料夾愣了三秒——不是因為快,是意識到:我這陣子把 Claude 跟 Codex 當競品在比,根本沒去想它們可能是隊友。

這篇就是把那三天我在做什麼、踩到什麼、最後收斂出什麼樣的工作流,完整寫一次給你。文末附一份起手包,整段貼給你的 AI 它就會接著帶你跑。

一個誠實的開場

我得先老實講一件事。我跟 Codex 的合作其實才剛開始一個月——這個月之前,我只用 ChatGPT 網頁版,不太碰 Codex CLI。轉折點是 OpenAI 重新訂閱送了我一個月 Plus,我那時順便去研究 Codex CLI 在訂閱裡能做什麼,才意外發現它可以接成 Claude Code 的 sub-agent。

所以這篇講的不是「我跑了一年的成熟工作流」,而是「我這個月還在摸索、但已經明顯感覺效率變好」的觀察筆記。我也還在學習這套作法。

但即使只跑了一個月,效率提升的差距大到讓我覺得值得寫一篇分享。下面就是我的觀察。

為什麼一個人值得同時養兩家 AI

一開始我也覺得「同時訂 Claude Max $200 + ChatGPT Plus $20」是雙重花費,每個月看到帳單心會抽一下。

但這個月我去看 Codex CLI 能做什麼之後才發現,原本我以為 ChatGPT Plus 我只是用網頁版聊天,結果 Codex CLI 在 Plus 訂閱內就能跑、不用切到 API 計費,9 張 carousel 跑完只是吃我訂閱配額的一小角,根本沒額外帳單。同一時間 Anthropic 推 Claude Skills 跟 Routines,把長期記憶跟工作流變一等公民——兩家方向開始互補而不是競爭。

我那時候的心情是這樣的:原來我每月多付的那 $20,不是浪費,是另一隻手。

但「把兩家串起來」聽起來很玄,到底要怎麼串?這就要先理解一件事——它們其實在語法上比你想像的更接近。

一份 markdown,兩家都讀

我為了搞清楚怎麼串,踩了幾次「兩邊認知不一致」的坑——我跟 Claude Code 講好的規則,Codex 接手時完全不知道,結果生出來的東西跟我預期差很遠。

收斂了一輪之後,我落腳在這個 4 層結構:

  1. 頂層規格層(共用):一份 slide-plan.md 寫 9 張 carousel 的規格——kicker、H1、強調色、mascot 姿勢、禁用詞,全部 token level 寫死。
  2. 規則層:CLAUDE.md 給 Claude Code 讀,AGENTS.md 給 Codex 讀。兩個檔在語法上幾乎相同,都是 Markdown,差別只在開頭的 identity 段落。
  3. Skill / 工具層:Claude 端有 ~/.claude/skills/,Codex 端有 plugin 跟 agent skill。各自有的能力,但讀同一份規格。
  4. 圖像引擎層:底層是 GPT Image-2 跟 Gemini API,由 Codex 或 Claude 視場景呼叫。

這個結構的好處是:我寫一次規格,兩家盲點不一樣、剛好互補。Claude 漏掉的細節 Codex 會抓到,反過來也是。

聽起來抽象,但實作其實只要三條命令。

5 分鐘 setup:三條真實命令

如果你已經在用 Claude Code,加 Codex CLI 接成 sub-agent 不是另外裝一套工具,是在 Claude Code 裡面跑:

# 1. 加 Codex 的 plugin marketplace 來源
/plugin marketplace add openai/codex-plugin-cc

# 2. 安裝 Codex 主 plugin
/plugin install codex@openai-codex

# 3. 跑 Codex 的初始 setup(會檢查 Codex CLI 是否裝好、走完登入)
/codex:setup

跑完之後,Claude Code 視窗就能直接呼叫 Codex 當 sub-agent。對我這種日常主要在 Claude Code 工作的人來說,體感是「Claude 一直是 Claude,但會自動派工」。

實際用起來大概像這樣。我直接打:

幫我用 Codex 跑這個 review,找出我漏抓的細節。

Claude 會自己走 codex:rescue 或 codex:adversarial-review,把任務丟給 Codex CLI,收回結果整合進回應。我不用切視窗、不用複製貼上,整個流程就在同一個對話裡完成。

但裝完之後,真正讓兩家越用越順的,不是這三條命令,是一個習慣。

讓 AI 累積經驗的習慣

剛開始用 Claude Code 那段時間,我每天都在重複貼同樣的 prompt 給它。「我要做 carousel、規格是 4:5、標題用橘色 #D4623B、不要動物 mascot⋯」一天貼五次,連我自己都覺得自己很笨。

後來我養成一個習慣:每次 AI 做出一個我覺得有用的解法,就請它打包成 skill。例如我會說:

未來要做圖像生成的時候,幫我把目前這套流程打包成 skill。
要包含:
- 哪個工具(Gemini API / Codex Image-2)做哪種場景
- 紅線(4:5 portrait、不用 sips center crop、ratio 容差 ±5%)
- 重試機制(超容差自動 retry 最多 2 次)
- 失敗 escalation 條件
存到 ~/.claude/skills/{合適的命名}/SKILL.md

累積下來,我 ~/.claude/skills/ 底下有 50+ 個 skill。每個都是一次「下次比上次更聰明」的累積。下一篇 carousel 開工的時候,我不用再貼那段 4:5 規格——Claude 自己讀 skill 檔就知道。

這個心法的關鍵字是 lessons learned。每次跑完不是直接收工,是想一下「這次學到什麼下次能用」,然後寫進 skill。Codex 端我也用同樣邏輯處理 plugin 跟 agent skill。

講到這裡都還很抽象。讓我用兩個真實場景把這套作法講清楚——一個寫程式、一個生圖。

場景一:寫程式 — Claude 仔細,Codex 跑量

CatDoes 那個 staff engineer 在 4/23 發了一份 Express.js refactor 的 benchmark。同一個任務,他給兩家 AI 各跑一次:

  • Claude Code:1 小時 17 分、用了 6.2M token、抓到了一個關鍵的邊角細節(一個 race condition)
  • Codex CLI:1 小時 41 分、用了 1.5M token、漏掉那個細節

Token 用量差 4 倍多,API 等價成本差 10 倍。Codex 便宜十分之一,但漏抓一個關鍵 bug。

我看到這份 benchmark 的時候第一個反應是:「所以還是 Claude 比較好嘛。」但後來我自己在改一個 auth flow 的時候,跑了同樣的對比實驗——讓 Claude 寫主邏輯,PR 送出前手動觸發 /codex:adversarial-review。Codex 用攻擊者視角跑了一輪,抓到一個我跟 Claude 都漏掉的邊角案例:兩個 session 同時 refresh token 會踩到。

那一刻我才真的懂 CatDoes 的數據在說什麼。它不是在說「貴的比較好」,它在說「貴的抓細節、便宜的跑量」。

這就是我現在的工作流分配:

  1. Claude 規劃 + 寫主邏輯(30% 時間):架構設計、寫主功能、跨檔案 refactor
  2. Codex 敵對審查(5% 時間):PR 送出前手動觸發 /codex:adversarial-review,Codex 主動嘗試破壞這段 code、找邊角細節跟 null check 漏的
  3. Claude 接 Codex 的攻擊報告改 code(15% 時間):知道後面有 attacker,Claude 從一開始就更防禦性
  4. Codex 跑量 — unit test、refactor 重複任務、跨檔案 rename(50% 時間):給 plan 之後連續執行 30 分鐘以上無人介入

這個分工的核心信念是 Claude 守關鍵、Codex 跑量。但寫程式只是其中一個場景,圖像生成是更顯著的對比。

場景二:圖像 — 從拼接到一條龍

文章開頭講的那個三天前的下午就是這個場景。讓我把那天的工作流攤開給你看。

我的 carousel 通常 9 張一組。過去用 Gemini API 路線是這樣:先讓 Claude Code 呼叫 Gemini API 生插圖、然後我搭 HTML 模板、把插圖塞進模板裡、用 Playwright 跑截圖。痛點不在生圖本身,是中間「塞插圖進模板」這段的視覺微調——這張位置偏左 20px、那張跟下面的表格擠到了、配色跟另一張不一致。9 張下來每張要回頭調個兩三次,整個下午就這樣過了。

整套作法本身已經比更早的工作流順很多,我前幾篇 Post 都在教這套。但每張背後 2-3 次微調 × 9 張,3-4 個小時跑不掉。

三天後改用 Codex CLI 之後,整段流程變成這樣:

cat instruction.txt | codex exec \
  --cd ~/your-project/ \
  --full-auto \
  -i ~/avatar-reference.png \
  -i ~/style-reference.jpg

一條命令、Codex 自己讀規格檔、自己跑 image_gen 9 次、自己量 sips ratio、超容差自己 retry、自己寫 session log。我這邊只看 final 9 張結果。我那天就是按完命令直接出門吃晚餐,回來資料夾整整齊齊。

從拼接到一條龍,差別不只是少幾步,是 Codex 內建了「生完自己驗、不對自己重來」的機制。我不再需要當品管。整個下午的注意力可以拿去做別的事。

不過 Codex CLI 在 Plus 訂閱裡跑也不是無限額度,這就要講到我這個月學到最痛的一課。

關於額度:上禮拜五晚上 11 點的故事

上禮拜五晚上 11 點,我在跑一個 carousel batch、9 張 image_gen。跑到第 6 張突然停了——不是 error 訊息、是 Codex 直接靜默無反應。我那時還沒搞懂機制,以為是 ngrok 或哪裡掛了,又重啟一次、再跑一次、又停。第二天早上才意識到:那不是 bug,是 5 小時 rolling window 滿了,要等重置。

從那次之後我的習慣是:30 分鐘以上的長任務一律睡前丟,白天只跑互動式對話。Claude Max 5 小時 rolling window 跑大型 refactor 一天大概能跑 2 到 3 輪,Codex Image-2 每月有上限、9 張 carousel 大約吃月配額的 1/30。聽起來好像很有空間,真的會擋。

講到 Plus 訂閱順便提一個我意外發現的好康。如果你之前停用過 ChatGPT Plus、最近重新訂閱,會自動送你 1 個月。我重新評估雙 AI 工作流的時候才意外發現的,閒置不用就是丟錢。

還有一件事可能會影響你的決定——OpenAI 在 4 月為 Claude Code 寫了一個官方 plugin,就是上面 setup 用到的 openai/codex-plugin-cc。這個 plugin 在 Hacker News 上被討論了 83K views。OpenAI 主動為 Anthropic 的 IDE 寫整合,等於官方背書「兩家可以協作」。這條路不是 hack。

不為了串接而串接

講到這裡,這篇文章看起來像在勸大家「兩家一定要串接才對」。但我想老實說一件事——其實不是。

串接的真正意義不是「同時用兩家」,而是讓你有空間根據任務交給最適合的 AI。串完之後最重要的不是工具本身,是你開始用「派工」的思維工作——這個 PR 該誰 review、這個 batch 該誰跑、這次生圖該怎麼分配。讓 AI 自己幫你管理任務分配,不是你每次手動切換工具。

但這也代表,如果你現在的工作流已經很順、你覺得 Claude 一家就夠了、或你只用 ChatGPT 也跑得很開心,那就不需要為了串接而串接。把這幾個小時拿去優化其他還在卡你的事,可能更划算。

看自己的成果需要的是什麼。如果你的瓶頸不在「兩家工具來回切換」,串接的價值就有限。但如果你已經在感受到「同樣的設定我又重做了一次」這種摩擦,那這篇講的這套作法可能是對的方向。

我這個月跑下來的節奏

最後分享一下我這個月實際的工作節奏,給你當參考。

早上九點開始,我會先跟 Claude 對話 30 分鐘,把當天要解的問題拆出來——通常是兩三個任務的 plan:哪個檔案要改、預計改幾行、會影響哪些測試。中午前我給 Claude 寫主邏輯,自己邊吃飯邊看它寫。下午兩點之後我把不需要創意的重複工作(unit test、refactor 變數名、跨檔案 rename)打包成 instruction.txt 丟 Codex 跑,那個 batch 通常會跑半小時到一小時,期間我自己處理 PR review、寫文件、開會。傍晚 Codex 跑完我把結果丟回 Claude 收一輪。

老實說這套節奏對我來說也還在優化中。三個禮拜前我才剛把 Codex CLI 接進來、上禮拜五晚上 11 點才知道什麼叫 rolling window 滿了、這個月跑了 18 篇 carousel 才慢慢摸到節奏。但已經明顯感覺到效率提升很多——有些下午我可以同時跑三件事,這在以前不可能。

我也還在學習這套作法。這篇是我這個月觀察到、整理給你的最新版。

如果你也想試試,下面有一份起手包可以下載。


起手包

我把上面講的整套作法整理成一份 markdown,設計給「直接貼給 AI 看」的格式——三步 setup、養 skill 心法的 prompt 範本、寫程式敵對審查範本、圖像 carousel 直生範本,還有額度查表跟雷區避雷。整份是繁中,貼給你的 Claude Code、ChatGPT、Gemini 它讀完就會接著帶你跑。

文章下方有下載卡片,點下去就能拿走。

Claude Code × Codex 雙 AI 起手包(paste-to-AI 版)

整份 instruction set 設計給 AI 直接讀——你可以把整段(或挑你要的段)貼給 Claude Code / ChatGPT / Gemini,它讀完就會跟你接力跑。重點在「養 skill 心法」:不每次從頭教 AI,讓它自己累積經驗、一次比一次更會做。

  • 「直接貼給 AI」的 SYSTEM 段(一段話讓 AI 進入 dual-AI 工作流導師模式)
  • 三步驟 setup directive(裝 Codex CLI / 綁 OpenAI 帳號 / 教 Claude Code 認得它)
  • 養 skill 心法 meta-prompt(教你的 AI 自己累積經驗、不每次從頭)
  • Coding 場景 pipeline(Claude 規劃 → Codex adversarial review → Claude 修)
  • 圖像場景 pipeline(Claude brief → Codex 生 → Claude QA → 失敗 loop)
  • 額度查表 + 跑前 guardrail(Codex 5h rolling / Image-2 每日 / Claude 訂閱)
  • 5 個常踩的坑(越權改 repo / native size / chrome 漂移 / 自動加英文字 / sips 變形)
免費下載完整資源包

.md 純文字檔,可直接複製到 Claude / ChatGPT 使用

圖文精簡版

這篇文章也有好讀的社群版本

追蹤 @be.ai.curator

每天分享用 AI 經營公司的實戰筆記