← 回到 Blog
從探索者到編排者:我這兩年走過的 AI stack 進化、跟 Karpathy 4 代演化對照
AI 公司日記·N

從探索者到編排者:我這兩年走過的 AI stack 進化、跟 Karpathy 4 代演化對照

上禮拜 Karpathy 在 Sequoia Ascent 2026 把 AI 工程拆成 4 代演化。我看完才發現自己這兩年也走過一模一樣的弧線。這篇是我的真實 stack 揭露、含 9 個淘汰工具、5 個主力配置、以及那批被 Claude 調度的「免費 API 軍隊」。

Claude CodeCodexGeminiNotionKarpathyAI 工作流工具紀律

上禮拜五晚上 11 點,我在剪一篇 Threads 草稿,順手點開 Andrej Karpathy 在 Sequoia Ascent 2026 的演講。原本只想抓兩句金句去當 hook。結果 17 分鐘看完,我把 Threads 草稿整篇刪掉重寫。

Karpathy 把 AI 工程拆成 4 代演化——怎麼說(Prompt Engineering,2022-2024),給什麼(Context Engineering,2025),怎麼治理(Harness Engineering,2026 上半年),怎麼編排(Agentic Engineering,2026/4 到現在)。然後他講了一句我整個被打中的話。

「這四代不是平行的潮流,是一條不斷向上移動的曲線。」

我關掉影片,回頭看了一下自己的訂閱清單。2024 那年我同時開著 20 多種 AI 工具。2026 現在剩 5 個主力。中間發生什麼事?這篇是我真實走過的路。

探索者(2023)— 還在試哪個工具 fit 你的工作

2023 GPT plus 剛開放台灣訂閱那波,我馬上刷卡。那時候我還在一家跨國獨角獸內部負責管理區域分公司,每週在台北、上海、新加坡之間往返。AI 對我是「神奇但不影響工作」的東西。

每次有問題打開 ChatGPT,問完就關。答案散在聊天紀錄裡,三天後想用找不到。輸出複製貼上到信件、再貼回對話讓 AI 改一改,整個過程沒有任何資產累積。我那時候不知道這叫「探索者」階段。Karpathy 後來幫我命名了,他叫第 1 代「怎麼說」——大家都在比誰問得好。

探索者不是初階。是還沒找到 AI 跟你工作的接合點。

如果你現在的感覺是「AI 很有趣但工作沒因此不一樣」,你大概在這個位置。可以做的第一件事很簡單:任何一次 AI 對話,結果直接複製進 Notion 一個專屬頁面。沒存下來的對話等於沒問過。

這個動作聽起來像廢話,但這就是進入下一階段的門票。

整合者(2024)— 學新工具的速度沒人比得上,但每個都只用 2 次

2024 公司大轉型,老闆指派我負責 AI 賦能專項。我才認真起來。

那一年我的訂閱清單從 ChatGPT 一個變成 20 多個。Perplexity、Gemini、Make.com、LovArt、Genspark、Manus、Flowith、Dify⋯只要 X 上有人推、Twitter 上有人秀工作流,我大概都試過。最高峰時應該超過 20 種同時開著。

那是我第一次感覺 AI 像同事。

具體一個畫面:2024 春天某個禮拜,我用 Make.com 接 Notion 跟 6 個地區社群帳號,做了一個多語言發文自動化。寫一次中文,串 GPT-4 翻成英日韓泰越,自動發到 6 個地區團隊頻道。那個禮拜我整個睡不著,原本每週花 3 小時做的事,5 分鐘做完。

但第 2 階段也有它的痛。

工具太多每天切換,到底哪個任務該用哪個?看別人秀新自動化心動,又訂一個,結果用不到 2 次就忘了。Prompt 寫得好的時候很順,寫不好的時候像 AI 智商被打折,沒有穩定性。

這就是 Karpathy 第 3 代「怎麼治理」階段——你開始需要 Eval(哪個工具好)跟 Guardrails(怎麼避免不穩定)。我那時候沒這些名詞,但行為已經是這樣:每週日固定打開訂閱列表,看哪個真的有用、沒用的砍。

整合者最關鍵的不是學新工具。是練砍工具的紀律。

編排者(2026)— 人類入口在 Claude Code、其他各司其職

2025 年中我回台灣創業,那時候做的第一件事反而是停止訂閱新工具。

原本的跨國公司轉成外部顧問。我開始用 Claude Code,寫自己的 CLAUDE.md,把每天重複做的事變成可以重複跑的指令。那一刻我意識到,前面 20 多個工具不是失敗,是學徒期必經。它們教我看清楚「位置」這件事——我的工作流真正需要的位置,其實只有 5 個。

這就是 Karpathy 第 4 代「怎麼編排」階段。不同 AI 派到不同位置上,Subagent、Orchestrator、MCP 串接。人類入口在 Claude Code,Claude 在前面把任務分給其他工具。

我 2026 現在的 5 個主力長這樣:

1. Claude Code (Max plan) — 人類入口

主線 Agent、系統組織者、調用其他 AI。所有工作從這裡進去。

寫文章先在 Claude Code,跑 carousel 生產也在 Claude Code,改 launchd 排程、debug 自家 LINE bot、整理 Notion 內容日曆全部在這。它不是「一個工具」,是我的工作介面本身。

選 Max plan 不是 Pro 的原因:30 天累積 API 等價用量約 8,400 美金,回本倍率 42 倍。產業認知 Claude 訂閱比按量計費省 15-30 倍,我用得比平均兇。

2. Codex (Pro plan) — 圖像 + Code Review + Jury 隊員

三個角色一個訂閱:

  • **Image-2 圖像生成**:繁中字重 carousel 封面、infographic、本篇 Blog 的 5 張 16:9 hero 全部 Codex 直生
  • **Code Review**:Claude Code 寫完 patch 後,丟 Codex 第二意見
  • **Jury Audit**:高風險 commit 前跑 3 reviewer 平行 audit

Pro plan 一個月 200 美金,比 ChatGPT plus 多很多,但這三個角色加總起來,光圖像生成一個月就回本。

3. Gemini (Pro plan) — 整個生態系補位

Gemini 不是「一個工具」,是「一整個訂閱解鎖一個生態系」:

  • **NotebookLM** 當我的長文件研究 + 內部陪審團(多 source 對齊判斷)
  • **Flow 平台 → Veo 3 影片**生成點數(一個月幾支高品質影片)
  • **Gemini CLI** 當隊員,跟 Claude Code 跨 CLI 協作
  • **雲端空間**放檔案跟圖片
  • **free tier API** 補位 LLM / 圖像 / 語音任務,Claude 統一調用

一個訂閱接通 5 個位置,這是我為什麼把 Gemini 當主力,不只當「另一家對話 AI」。

4. Notion — 數據中台跟公司 KM

Notion 在我這裡不是筆記軟體,是後台:

  • **自帶 Agent** 深入檢索內容日曆 / 海巡紀錄 / 業務資料
  • **MCP** 讓我的整套 AI 團隊使用 Notion DB
  • **API** 串輕量產品後台(DM Relay 觸發紀錄、社群表現 dashboard)
  • **公司內部** KM、會議紀錄、決策歷史全部在這

它跟 Claude Code 配對的時候威力最大——Claude 寫的東西自動進 Notion,Notion 的東西自動被 Claude 調用,雙向流動。

5. Typeless — 語音輸入(有免費版可用)

最近兩個月才加進來的工具。比 WhisperFlow 穩、有免費版可用、轉錄品質明顯好。出門走路時想到的想法,按一下講完,直接進 Notion 一個 inbox 頁面,等回家用 Claude Code 整理。

不打字這件事,對長期使用 AI 的人是很重要的省力槓桿。

加上一支沒在訂閱列表的軍隊:免費 API

5 個主力之外,我還有一支補位軍隊——一批免費 tier 的 API:

  • 免費 LLM API(Gemini free tier、Groq、Together)— 量大但不需要最強智能的任務丟過去
  • 免費圖像 API(Stability free / Imagen 試用點數)— 不是 carousel 級的小圖
  • 免費語音 API(ElevenLabs free / Gemini TTS)— 短語音生成

這支軍隊由 Claude Code 統一調度。我不直接打它們,我下令給 Claude,Claude 決定派誰去。這個結構讓我月費總額穩定在 5 個訂閱,但能用的 AI 算力是 5 倍以上。

archive — 我這兩年退場的 9 個工具,跟被誰覆蓋

整合期到編排期之間,發生了一場大規模退役。完整 list:

  • **Make.com** → 被 Claude Routines 跟 cron 腳本取代。當年 visual node editor 很直覺,但寫 prompt + 排程比拉節點快 10 倍
  • **n8n** → 同上,cron 腳本覆蓋
  • **LovArt** → 被 Codex Image-2 取代。繁中字重輸贏差距太大
  • **Canva** → 簡報跟設計被 Codex Image-2 + HTML 模板取代
  • **Gamma** → 同上
  • **Genspark** → Claude Code 完全覆蓋 Agent 工作流
  • **Manus** → 同上
  • **Flowith** → 同上
  • **Dify** → 同上

這 9 個工具不是「不好」,是「我超越了它們需要的位置」。把它們留下來會讓我每天打開 9 個視窗、心智成本爆表。

砍工具的紀律比學工具難。學工具是好奇心,砍工具是承認「我之前的選擇現在不對了」。

Karpathy 4 代 × 我 3 階段對照地圖

這份對照不是說「你也要走我這條路」。是說明:如果你現在卡在某個感受,可能有一代演化已經給出了答案。

結語:3 個階段沒有高低

最後想講一件事——3 個階段沒有高低,只是不同時期不同 mindset。

我現在是編排者,但下一波技術來,我可能又會變回探索者。AI 圈每 3-6 個月會有一次大跳躍,沒有人能一直站在最前面。重要的不是「我在哪一階段」,是「我有沒有清楚知道自己在哪一階段、下一步可以走去哪」。

回頭看這兩年最重要學到的事,不在我用了什麼工具,在我學會了砍工具。加工具誰都會。真正的進階,是知道哪個位置已經有人坐了,就不再多請一個。

文章下方有下載卡片可以拿走——含 4 件給你直接 paste-to-AI 的資源(提問模板 10 個情境、2024 Make.com 自動化範例 archive 版、Notion 編排者模板、Karpathy 4 代 × 3 階段對照地圖 PDF)。

如果你看完想分享你現在站在哪一階段,IG 跟 Threads 留言區見。我想知道大家的分布。

AI 主理人之路 — 4 件可帶走的資源

搭配「從探索者到編排者」這篇文章的整套資源。我把 2 年走過的 AI stack 進化攤平成 4 件可重複使用的工具:10 個常用情境提問模板、2024 Make.com 多語言發文範例(archive 版、現在用 Claude Routines 取代但對整合期入門依然有用)、Notion 編排者資料庫設計、Karpathy 4 代 × 我 3 階段對照地圖。一份檔案攤平 4 段、直接 paste-to-AI。

  • 提問模板 10 個情境(每天回信 / 寫週報 / 整理會議紀錄 / 競品調研 / 提案開頭 / 客戶痛點訪談 / 教學素材 / Threads 草稿 / 出差行程 / 招募 JD)
  • 2024 Make.com 多語言發文 workflow archive 版(脫敏 step-by-step、含 trigger / 翻譯並行 / 6 地區頻道並行 / Notion 回寫)
  • Notion「AI 對話歸檔」資料庫設計(properties / views / 用法心法)
  • Karpathy 4 代 × 我 3 階段對照地圖(一頁表格、可直接印)
免費下載完整資源包

.md 純文字檔,可直接複製到 Claude / ChatGPT 使用

圖文精簡版

這篇文章也有好讀的社群版本

追蹤 @be.ai.curator

每天分享用 AI 經營公司的實戰筆記