提示詞工程已經不夠了 —— 你的 AI 需要 Harness Engineering

你花了很多時間學怎麼跟 AI 說話。

下載了一堆提示詞範本，學習了各種提示詞架構，但總覺得距離「建立一個懂你的 AI 團隊」這個目標越來越遠。每次開一個新對話，從頭解釋你是誰、你要什麼、格式怎樣 —— 覺得自己好像一個複製貼上機器？

在 2026 年，AI 絕對有能力自己跑完一整個任務。但如果你每次都在空白視窗裡從零開始，再厲害的提示詞也救不了。

問題不在提示詞。問題在你沒有幫 AI 建好工作環境。

便利貼 vs 辦公室

差別有多大？想像給 AI 一張便利貼 vs 一間辦公室。

你在便利貼上寫「幫我做月報」，跟你給新人一張桌子、一台電腦、公司的 SOP 手冊、上個月的報告範本 —— 產出品質能一樣嗎？

便利貼 = 每次對話從頭開始。辦公室 = 你把背景、規則、範例、工具一次設定好，之後 AI 每次都記得。

這個「從便利貼升級到辦公室」的過程，業界叫它 Harness Engineering（環境工程）。

你的 AI 工具，其實已經準備好了

很多人不知道，現在 ChatGPT、Claude、Gemini 都已經內建了「辦公室」功能。一個完整的工作環境有三個基礎設施：

1. Instructions（工作說明書）

告訴 AI 你是誰、你要什麼格式、什麼不能做。ChatGPT 在 Project Instructions 裡設定，Claude 在 Projects 裡設定，Gemini 用 Gems。

2. Knowledge（參考資料）

上傳公司 SOP、過去的報告範本、品牌指南。AI 每次對話都自動參考，不用你手動貼。

3. Tools（工具連接）

ChatGPT 可以連 Google Drive，Claude 支援 38 種以上的 Connectors（Notion、Slack、Jira⋯），Gemini 用 @ 叫出 Gmail、Drive、Calendar。

⚡

這些功能現在就有，打開 App 或網頁即刻使用。設定一次，永久生效。

Claude Code：辦公室可以自己進化

如果你已經在用 Claude Code，能做的事遠不止「設定說明書」。真正把 Harness 跟「好的提示詞」拉開差距的，是以下四個功能形成的自我進化迴路：

CLAUDE.md —— 工作說明書

不要寫成百科全書。100 行以內當目錄就好，索引你的資料夾架構，讓 AI 需要時自己去讀。

Skills —— 工作流程的 SOP

教一次，打包成技能檔，下次遇到類似任務自動觸發。你也可以寫組合型技能，把多個技能串成自動化工作流。

Memory —— 跨對話記憶

不是「記住你叫什麼」那種單一對話記憶。是從上次犯的錯中學習、下次自動避開的機制。跨對話、跨天、持續進化。

Hooks —— 自動品管

AI 每次動作後系統自動檢查：寫完程式碼自動跑測試、產出文案自動品質審查。不用自己盯，系統有一道自己的防線。

🔄

這四個功能互相餵養，形成自我進化的迴路：CLAUDE.md 定規則 → Skills 自動執行 → Hooks 品管檢查 → Memory 記住教訓 → 回頭更新 CLAUDE.md。

把 Harness 建到位，成果有多誇張

OpenAI — 開發新產品時的內部實驗

3 個工程師用 Codex（AI 程式助手）開發 5 個月，交出一百萬行程式碼、1,500 個 PR —— 零行手寫。關鍵不是 Model 比較強，是 Harness 建到位：100 行的說明書當目錄索引、每次改動自動跑程式碼檢查、AI 自己截圖驗證結果。

OpenAI 官方文章：Harness Engineering

Stripe — 全球線上支付龍頭

內部做了一套叫 Minions 的 AI 系統。每週超過一千筆程式更新由 AI 完成 —— 工程師在 Slack 按一個表情符號就觸發。出錯了？自動回滾。全靠寫進 Harness 的規則和檢查機制。

Anthropic — Claude 的開發公司

Claude Code 自己就用兩階段 Agent 架構：先規劃再執行。透過 JSON 鎖住計劃防止 AI 偷改、檔案傳遞跨對話狀態。單次任務獨立運作超過 6 小時。

Anthropic 官方文章：Effective Harnesses for Long-Running Agents

共同點：都不是因為 Model 更強，是把規則、檢查、回饋全部建進了工作環境。

今天就開始你的第一步

1. 認清差距 —— 你跟 AI 之間的瓶頸不是提示詞寫得不夠好，是它每次都在空白的房間裡從零開始。

2. 馬上行動 —— 打開你最常用的 AI 工具 → 寫好 Instructions → 上傳參考資料 → 連接工具。下一次對話就生效。

3. 持續進化 —— 進階用 Claude Code 加上 Skills + Memory + Hooks，讓 AI 從錯誤中學習、自動檢查、越用越準。

🏢

2023 年你只需要一張便利貼 — Prompt Engineering 2026 年你需要一整個辦公室 — Harness Engineering 大語言模型只會越來越便宜。怎麼幫它建立好的工作環境，才是差異化。

延伸閱讀

本文的研究基礎來自以下原始文章，推薦深入閱讀：

OpenAI — 3 個人用 Codex 產出百萬行程式碼的完整紀錄

https://openai.com/index/harness-engineering/

Anthropic — 兩階段 Agent 架構、跨 session 狀態傳遞

https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

LangChain — Agent = Model + Harness 公式

https://www.langchain.com/blog/the-anatomy-of-an-agent-harness

Martin Fowler — Guide + Sensor 理論框架

https://martinfowler.com/articles/harness-engineering.html

Stripe — 每週 1,000+ 筆 AI 完成的更新背後的系統

https://stripe.dev/blog