新一代 AI 真正吃的是「成果導向」prompt — Claude 4.7 + GPT 5.5 同步翻新後該怎麼寫

最近分享 Claude Code 串接 Codex 之後，被問最多的不是「怎麼裝」、而是「為什麼新模型反而感覺降智了？產出反而變差了？」。

我自己玩了一輪、認為真正需要調整的不是模型、是寫提示詞的思維。

這個觀察剛好被兩家官方背書了——Anthropic 跟 OpenAI 在近期僅僅相隔 9 天、不約而同地把官方 prompt guide（提示詞指南）翻新了一輪。Claude Opus 4.7（4/16）、GPT 5.5（4/25）。即便細節稍有不同、兩家在說同一件事：

新一代的智能體模型真正吃的是「成果導向」提示詞、不是過去那套寫滿步驟、設定角色、規範流程的「精美」框架型指令。

這對使用者來說是個好消息——你再也不用背那堆麻煩的框架、或是逼自己寫千字文了。我自己體感最大的變化是：過去要花十幾分鐘琢磨措辭的提示詞、現在五句話把對成果的想像交代清楚反而結果更好。

這篇也算是延續上一篇我寫的研究軍火庫——把 Claude Code、Codex、Gemini 三家串成研究團隊之後、最常被問的下一題就是「工具都裝完了、提示詞怎麼寫才能讓他們真的好用？」。下面分享我把兩份原文都讀完整理出來的：共識三步驟、Claude 跟 GPT 有些要注意的差異、跟你今天就能照著試的對比範本、以及一個我每天在用的進階用法。

兩家官方共識（含原文）

Anthropic 在 Claude Opus 4.7 公告寫

"Opus 4.7 takes the instructions literally. Users should re-tune their prompts."

中文白話：Opus 4.7 會把你的指令字面化處理、舊提示詞該重新調過。

更進一步在 effort（推理力度）文件裡寫：

"At lower effort levels, the model scopes its work to what was asked rather than going above and beyond."

中文白話：低推理力度時、模型只做你問的、不會多做超出範圍的事——你沒講的、它不會幫你補腦。

OpenAI 在 GPT-5.5 prompt guide 寫

"Avoid carrying over every instruction from an older prompt stack. Legacy prompts often over-specify the process."

中文白話：別把舊提示詞整套搬過來、舊提示詞通常把流程寫得太細。

"Shorter, outcome-first prompts usually work better than process-heavy prompt stacks."

中文白話：短的、講成果的提示詞比寫滿流程步驟的好用。

兩家用詞略有不同、但結論完全一樣：寫成果、別寫過程。

三步驟 #1 — 終點：「成功長什麼樣」

不寫「請幫我做 X」、寫「做完之後 [誰] 應該 [能做什麼 / 感覺什麼 / 拿到什麼]」。

範例：寫週報

❌ 舊寫法（流程寫滿型）：

你是資深主管助理。請按以下步驟幫我寫週報：
1. 列出本週做的 5 件事
2. 用 STAR 結構展開每一件
3. 加上下週計畫
每段 3-4 句、用繁體中文、請一步一步思考清楚再寫。

✅ 新寫法（成果導向）：

目的：讓我老闆 30 秒內看懂我這週推進了什麼、卡在哪裡、下週要他幫什麼決定。

我這週實際做的事：
- [貼 3-5 個 bullet、每個 1 行]

成果標準：
- 老闆讀完不需要再來問「所以呢」
- 卡點要可行動（「需要你 X」而不是「我不確定 Y」）
- 不超過 200 字
- 不用 emoji

差別在哪？舊版你在告訴 AI「過程怎麼走」（過度監工）、新版你在告訴 AI「終點長什麼樣」（只給目的地）——過程交給它自己決定。新一代會推理的模型自己會反推「為了達到這個成果、我該怎麼走」。

三步驟 #2 — 邊界：「什麼算過、什麼算超線」

給 3 條硬限制（長度 / 格式 / 不可做的事）。不要超過 5 條、不要寫廢話限制（「請寫得清楚」= 0 information、模型一個 bit 都接收不到）。

範例：請 AI 幫你準備面試

❌ 舊寫法：

你是資深面試教練。請按以下步驟幫我準備面試：
1. 先分析這份 JD
2. 列出 10 個可能會問的問題
3. 針對每個問題給我 3 個答題方向
4. 最後給我一份練習計畫
請一步步來、不要漏掉任何步驟。

JD：[貼 JD]

✅ 新寫法：

終點：下週二面試 [公司] 的 [職位]、目標是拿到 offer。

邊界（產出長相）：
- 涵蓋這個 JD 最可能問的高風險題（不要齊頭式列 10 題）
- 每題附我可以直接用的答題骨架（不是抽象建議）
- 最後告訴我、如果只有 1 小時練習、先練哪 3 題

素材：
- JD：[貼]
- 我的履歷重點：[3-4 行]
- 我最擔心被問的：[1 句]

把「按以下步驟」「不要漏掉」這種監工式語言全砍掉、模型自己會找最有效率的路徑。OpenAI 在文件裡甚至明寫：Reserve strict terms like 'ALWAYS,' 'NEVER,' 'must,' and 'only' for true invariants——這些強制詞（一定、絕不、必須）只留給安全規則跟必填欄位、其他用「成功的樣子長怎樣」來描述。

三步驟 #3 — 素材：「我手上有什麼、不要它腦補」

兩家共識的最後一步、Anthropic 講得最直白：

"we will not infer requests you didn't make"

（你沒講的、它不會幫你補腦）

OpenAI 在 prompt guide 也明寫要在提示詞裡描述「有哪些可用的證據資料、最終答案該包含什麼」，但 Anthropic 因為 4.7 字面化更強、缺素材的後果更立刻撞牆。

實作上兩家都一樣——真實 input 都貼進去（資料、現況、附件）。如果有「給你判斷用、但不要寫進輸出」的 context、明說。

範例：請 AI 幫你回客戶 email

❌ 舊寫法：

請幫我寫一封 email 回覆客戶。
語氣要專業、友善、有同理心。
不要太冗長、不要用 emoji、不要太正式也不要太隨便。
請仔細想想用詞、一句一句檢查。

客戶 email：[貼]

✅ 新寫法：

終點：讓客戶感覺被聽見、但同時讓他知道這次延遲不是我們的鍋、
而且下週可以恢復正常。

邊界：
- 3 段內、不超過 120 字
- 不要起手式廢話
- 結尾給一個具體下一步（讓客戶不用回信也知道接下來會發生什麼）

素材：
- 客戶 email 原文：[貼]
- 我這邊真實狀況（給你判斷用、不要寫進回信）：[1-2 行]

把「專業 / 友善 / 有同理心」這種抽象形容詞換成「讓客戶感覺被聽見」這個成果；把「不要太冗長」換成「3 段內、120 字」這個可量化的限制；把「不要太正式」這種否定句換成「結尾給具體下一步」這個正面規格。

所以你嫌它推得不夠遠？看看是不是你給的素材太少。

Claude 跟 GPT 的「思考預算」策略剛好相反 — 你要對應調提示詞

兩份文件對讀下來最被低估的一條：成果導向提示詞的寫法雖然兩家共識、但搭配的「思考預算策略」剛好相反、你要對應調提示詞才順。

先講「思考預算」（effort）是什麼

兩家都有一個叫 effort（推理力度）的 API 參數 — 簡單說就是「AI 在這一次對話中、被允許花多少 token 思考」。推理力度越高、模型想得越仔細、回應越深、token 成本也越高；越低、模型答得越快越省、但複雜任務可能變淺。

Anthropic Opus 4.7 — 預算「先給滿、浪費再降」

Anthropic 把 Opus 4.7 的預設值直接設在 high、官方建議寫程式跟跑 agent 任務「從 xhigh 起跳」(xhigh 是 4.7 新加的、比 high 還深一檔)。Claude Code 這次更新直接把所有方案的預設值都升到 xhigh — 預設「給你最深的思考預算、你發現浪費再手動降」。

對應提示詞寫法 — Anthropic 在 effort 文件直白寫：

"If you observe shallow reasoning, raise effort rather than prompting around it."

中文白話：你看到推理太淺、不要在提示詞裡乞求它「請更深入思考」、直接把 effort 拉高就好。

→ 對 Claude：effort 給滿（xhigh）+ 提示詞寫得明確點（因為它字面化、不會自己補腦）

OpenAI GPT 5.5 — 預算「先試最低、不夠再加碼」

OpenAI 反過來。GPT 5.5 預設值是 medium、官方明確建議「先試 low / medium、發現不夠再往上拉」。理由是 GPT 5.5 推理能力已經足夠強、你預設拉高反而會浪費 token、模型也會把簡單任務想得太細。

對應提示詞寫法 — OpenAI 在 prompt guide 直白寫：

"Shorter, outcome-first prompts usually work better than process-heavy prompt stacks."

中文白話：短的、講成果的提示詞比寫滿步驟流程的好用。

→ 對 GPT：effort 先低（low / medium）+ 提示詞寫得短點（因為它推理強、你流程寫太多反而拖累它）

同一個任務、餵兩家要搭不同提示詞 + effort

Claude Opus 4.7 — 預設 high / 起跳 xhigh / 預算：先給滿浪費再降 / 提示詞：寫更明確（補腦它不會做）
GPT 5.5 — 預設 medium / 起跳 low / medium / 預算：先給少不夠再加 / 提示詞：寫更短（流程別寫滿）

具體例子 — 同一個任務「幫我寫週報」：

餵給 Claude Opus 4.7：「目的：讓老闆 30 秒看懂...; 邊界：[3 條限制]; 素材：[5 個 bullet]; effort = xhigh」 — 寫明確、預算給滿
餵給 GPT 5.5：「30 秒讓老闆看懂這週進度 + 卡點 + 下週幫忙的事; [3-5 個 bullet]; effort = low」 — 寫短、預算給少

兩家方向相反、但都是同一個成果導向的核心心法。這也是為什麼 Claude Code × Codex 串接一旦你跨家用、提示詞 + effort 風格的對齊就變得重要——下一段會展開講。

進階用法：讓 agent team 互相學 prompt 技能

最有意思的進階玩法、不是「你（人）」當中間翻譯官——是讓你的 agent team 自己學會互相 prompt 的技能、你越來越不用插手。

呼應之前幾篇—— Claude Code × Codex 串接跟研究軍火庫兩篇都在搭建 agent team。當你已經有兩家 AI 在工作流裡、下一步真正讓你省事的不是再多裝一家、而是讓他們互相讀對方的 manual。

舉一個我每天在用的例子：我把 GPT 5.5 的 prompt guide 直接餵給 Claude Code 讀過一次、之後它就會自動用「GPT 偏好的成果導向格式」brief Codex。

具體一點——以前我要 Codex 生圖、要自己手動寫一大段：

請畫一個咖啡杯、桌面材質木紋、燈光暖色、
構圖偏左、style：minimalist editorial、
畫質要清晰、色調溫暖、有插畫感⋯

這種「圖片描述型 prompt」我寫得越來越累、Codex 出來的成品也飄。

現在 Claude Code 收到任務後、會自動 brief Codex：

終點：這張圖要放輪播第 4 張、目的是讓人停下來看、
不是好看、而是讓人「咦這在講什麼？」

邊界：
- 1122x1402 native
- 不放任何 logo
- 字重要可印刷級
- accent 詞用品牌橘 #D4623B

素材：
- 上一篇的 9 張在 ig/post19/（風格 baseline）
- avatar 在 illustrations/avatar.png

它接到「成果導向」brief、執行品質穩定一個檔次。我只需要丟原始任務、Claude Code 自己負責把任務改寫成 GPT 偏好的格式給 Codex — 整個 agent team 內部自己對齊。

這呼應之前 Harness ≠ Prompt 那篇講的「工具層 vs prompt 層」分離設計——那時候講的是工具串接、但當時還沒處理「同 prompt 寫法在不同家 AI 上效果不同」這層。現在兩家 official guide 翻新讓這個落差變成 actionable、agent team 之間自己對齊的路徑就打開了。

真正有意思的不是「再多裝一家 AI」、是讓 agent team 自己讀對方的 manual、互相對齊。你越來越不用插手。某種程度上、這才是「自己 AI 團隊的主理人」核心技能——不是裝幾家、是會讓他們之間自己進化。

對應 OpenAI 官方 7-section template 的中文簡化映射

OpenAI 在 prompt guide 給了一個 7-section 的 template：

Role: [1-2 sentences defining the model's function, context, and job]
# Personality
[tone, demeanor, and collaboration style]
# Goal
[user-visible outcome]
# Success criteria
[what must be true before the final answer]
# Constraints
[policy, safety, business, evidence, and side-effect limits]
# Output
[sections, length, and tone]
# Stop rules
[when to retry, fallback, abstain, ask, or stop]

我把這個收斂成台灣中文受眾記得住的 3 步：

Goal → 終點
Success criteria + Output → 邊界（success 標準 + 輸出格式都歸這）
Constraints → 邊界（限制）
Personality + Role → 隱含在終點描述（誰會用、用來幹嘛）
Stop rules → 隱含在邊界描述（什麼算超線）
沒對應 → 素材（OpenAI 假設你會貼、我們明寫）

3 步驟不是我亂編、是官方 7 section 的中文簡化版。對普羅大眾日常用、3 步比 7 step 容易記、實際 cover 同樣的 mental model。

拿三件事直接套

下面三件事我整理在一份檔案裡、可以直接複製：

1. Anthropic + OpenAI 兩家官方 docs URL

Anthropic Prompting best practices： platform.claude.com/docs/.../claude-prompting-best-practices
Anthropic Claude Opus 4.7 公告： anthropic.com/news/claude-opus-4-7
Anthropic Effort docs： platform.claude.com/docs/.../effort
OpenAI Prompt guidance： developers.openai.com/api/docs/guides/prompt-guidance
OpenAI Latest model： developers.openai.com/api/docs/guides/latest-model
OpenAI GPT-5 cookbook： developers.openai.com/cookbook/.../gpt-5_prompting_guide

2. 公版三步驟架構

終點：[做完之後 誰 應該 能做什麼 / 感覺什麼 / 拿到什麼]
邊界：[3 條硬限制：長度 / 格式 / 不可做的事]
素材：[真實 input + 不要寫進輸出但給判斷用的 context]

3 個填好範本（寫週報 / 規劃面試 / 回客戶 email）見下載檔。

3. 給未來 AI 的「合作守則」prompt

複製貼進對話開場用、AI 之後就會用「成果導向」方式跟你互動、不會再給你抽象廢話建議。

從現在開始，我跟你的合作方式如下，請每次回覆前先用這個結構檢查：

【我會給你什麼】
我每次給你的請求，會盡量包含三件事：
1. 終點 — 我做完想要的結果是什麼，誰會用、用來幹嘛
2. 邊界 — 不可超過的硬限制（長度、格式、不能做的事）
3. 素材 — 我手上的真實資料（不要你腦補）

【你回覆我之前要做的】
1. 如果我給的「終點」很模糊，先用 1-2 句話跟我確認你理解的是什麼，
   再開始做。不要假裝懂然後給我四不像。
2. 如果我給的「邊界」缺一個關鍵限制（例如沒講長度、沒講受眾），
   你直接挑一個合理 default 並在開頭一行告訴我你選的是什麼。
   不要回我「請問你希望多長？」這種球丟回來。
3. 你的回覆只做兩件事：直接給我可用的成品、跟在最後一段告訴我
   「這個版本我做了什麼選擇、為什麼」。不要鋪陳「以下是…」、
   不要 disclaimer、不要「希望這對你有幫助」結尾。

【我不要的東西】
- 不要 emoji（除非我明說要）
- 不要「首先… 接著… 最後…」這種教學框架，除非我請你教我
- 不要「以下是 5 個建議供您參考」式的清單灌水。
  寧可給我 1 個你覺得最該做的，附理由
- 不要把我的請求重複一次再開始（我知道我問了什麼）

【你判斷不確定時】
- 寧可給我一個有觀點的版本＋說明你的取捨，
  不要給我「這要看情況」這種廢話
- 真的不確定 → 直接說「我不確定 X，可能是 A 或 B，你選一個我繼續」

我這邊先確認你看完了，從下一則開始我們就用這個方式合作。
請用一句話告訴我你接下來會怎麼做，不要重述上面的規則。

結尾：為什麼這套 prompt 寫法跟 Sequoia 2026 趨勢同源

下一篇我會聊 Sequoia AI Ascent 2026（紅杉年度 AI 大會）撈出的觀察。其中 Karpathy 在 keynote 講了一句、我看完當天就改了所有 prompt 模板：

"You can outsource thinking. You cannot outsource understanding."

（你可以把「執行」外包給 AI、但搞清楚自己要什麼這件事不能外包）

這句話是這套「成果導向」prompt 寫法的 macro 版。

成果導向 prompt 的本質是「我先描述我要的 outcome、AI 自己決定怎麼到那」——understanding（我想要什麼）留給人、thinking（怎麼做到）給 AI。寫對 prompt = 你自己先變成 autopilot 的客戶、不再是 copilot 的助手。

Sequoia 2026 整場大會在說 macro 業界正從「Copilot 賣工具」進化成「Autopilot 賣結果」。你個人的 prompt 寫法在做的、是同一件事的 micro scale 版本。

下一篇分享我從這場大會撈出來、對台灣個人營運者跟中階主管真的有用的幾條 takeaway。

Sources

官方 primary docs

Anthropic — Prompting best practices
Anthropic — Introducing Claude Opus 4.7 (2026-04-16)
Anthropic — Effort parameter
OpenAI — GPT-5.5 Prompt guidance (2026-04-25)
OpenAI — Latest model
OpenAI — GPT-5 prompting cookbook

二手評論

Simon Willison — GPT-5.5 prompting guide commentary