← 回到 Blog
提示詞工程已經不夠了 —— 你的 AI 需要 Harness Engineering
AI 工作流·N

提示詞工程已經不夠了 —— 你的 AI 需要 Harness Engineering

從基礎設定到進階四件套,再到業界怎麼用 Harness 把 AI 產出拉到另一個維度。

你花了很多時間學怎麼跟 AI 說話。

下載了一堆提示詞範本,學習了各種提示詞架構,但總覺得距離「建立一個懂你的 AI 團隊」這個目標越來越遠。每次開一個新對話,從頭解釋你是誰、你要什麼、格式怎樣 —— 覺得自己好像一個複製貼上機器?

在 2026 年,AI 絕對有能力自己跑完一整個任務。但如果你每次都在空白視窗裡從零開始,再厲害的提示詞也救不了。

問題不在提示詞。問題在你沒有幫 AI 建好工作環境


便利貼 vs 辦公室

差別有多大?想像給 AI 一張便利貼 vs 一間辦公室。

你在便利貼上寫「幫我做月報」,跟你給新人一張桌子、一台電腦、公司的 SOP 手冊、上個月的報告範本 —— 產出品質能一樣嗎?

便利貼 = 每次對話從頭開始。 辦公室 = 你把背景、規則、範例、工具一次設定好,之後 AI 每次都記得。

這個「從便利貼升級到辦公室」的過程,業界叫它 Harness Engineering(環境工程)


你的 AI 工具,其實已經準備好了

很多人不知道,現在 ChatGPT、Claude、Gemini 都已經內建了「辦公室」功能。一個完整的工作環境有三個基礎設施:

1. Instructions(工作說明書)

告訴 AI 你是誰、你要什麼格式、什麼不能做。ChatGPT 在 Project Instructions 裡設定,Claude 在 Projects 裡設定,Gemini 用 Gems。

2. Knowledge(參考資料)

上傳公司 SOP、過去的報告範本、品牌指南。AI 每次對話都自動參考,不用你手動貼。

3. Tools(工具連接)

ChatGPT 可以連 Google Drive,Claude 支援 38 種以上的 Connectors(Notion、Slack、Jira⋯),Gemini 用 @ 叫出 Gmail、Drive、Calendar。

這些功能現在就有,打開 App 或網頁即刻使用。設定一次,永久生效。

Claude Code:辦公室可以自己進化

如果你已經在用 Claude Code,能做的事遠不止「設定說明書」。真正把 Harness 跟「好的提示詞」拉開差距的,是以下四個功能形成的自我進化迴路:

CLAUDE.md —— 工作說明書

不要寫成百科全書。100 行以內當目錄就好,索引你的資料夾架構,讓 AI 需要時自己去讀。

Skills —— 工作流程的 SOP

教一次,打包成技能檔,下次遇到類似任務自動觸發。你也可以寫組合型技能,把多個技能串成自動化工作流。

Memory —— 跨對話記憶

不是「記住你叫什麼」那種單一對話記憶。是從上次犯的錯中學習、下次自動避開的機制。跨對話、跨天、持續進化。

Hooks —— 自動品管

AI 每次動作後系統自動檢查:寫完程式碼自動跑測試、產出文案自動品質審查。不用自己盯,系統有一道自己的防線。

🔄
這四個功能互相餵養,形成自我進化的迴路:CLAUDE.md 定規則 → Skills 自動執行 → Hooks 品管檢查 → Memory 記住教訓 → 回頭更新 CLAUDE.md。

把 Harness 建到位,成果有多誇張

OpenAI — 開發新產品時的內部實驗

3 個工程師用 Codex(AI 程式助手)開發 5 個月,交出一百萬行程式碼、1,500 個 PR —— 零行手寫。關鍵不是 Model 比較強,是 Harness 建到位:100 行的說明書當目錄索引、每次改動自動跑程式碼檢查、AI 自己截圖驗證結果。

OpenAI 官方文章:Harness Engineering

Stripe — 全球線上支付龍頭

內部做了一套叫 Minions 的 AI 系統。每週超過一千筆程式更新由 AI 完成 —— 工程師在 Slack 按一個表情符號就觸發。出錯了?自動回滾。全靠寫進 Harness 的規則和檢查機制。

Anthropic — Claude 的開發公司

Claude Code 自己就用兩階段 Agent 架構:先規劃再執行。透過 JSON 鎖住計劃防止 AI 偷改、檔案傳遞跨對話狀態。單次任務獨立運作超過 6 小時。

Anthropic 官方文章:Effective Harnesses for Long-Running Agents

共同點:都不是因為 Model 更強,是把規則、檢查、回饋全部建進了工作環境


今天就開始你的第一步

1. 認清差距 —— 你跟 AI 之間的瓶頸不是提示詞寫得不夠好,是它每次都在空白的房間裡從零開始。

2. 馬上行動 —— 打開你最常用的 AI 工具 → 寫好 Instructions → 上傳參考資料 → 連接工具。下一次對話就生效。

3. 持續進化 —— 進階用 Claude Code 加上 Skills + Memory + Hooks,讓 AI 從錯誤中學習、自動檢查、越用越準。

🏢
2023 年你只需要一張便利貼 — Prompt Engineering 2026 年你需要一整個辦公室 — Harness Engineering 大語言模型只會越來越便宜。怎麼幫它建立好的工作環境,才是差異化。

延伸閱讀

本文的研究基礎來自以下原始文章,推薦深入閱讀:

OpenAI — 3 個人用 Codex 產出百萬行程式碼的完整紀錄
https://openai.com/index/harness-engineering/
Anthropic — 兩階段 Agent 架構、跨 session 狀態傳遞
https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents
LangChain — Agent = Model + Harness 公式
https://www.langchain.com/blog/the-anatomy-of-an-agent-harness
Martin Fowler — Guide + Sensor 理論框架
https://martinfowler.com/articles/harness-engineering.html
Stripe — 每週 1,000+ 筆 AI 完成的更新背後的系統
https://stripe.dev/blog

Harness Engineering 起手模板包

4 份模板 — ChatGPT / Claude / Gemini 各一 + Harness 自查清單

  • ChatGPT Project Instructions 範例
  • Claude CLAUDE.md 起手模板
  • Gemini Gems 設定模板
  • Harness 自查清單(10 題計分)
免費下載完整資源包

.md 純文字檔,可直接複製到 Claude / ChatGPT 使用

圖文精簡版

這篇文章也有好讀的社群版本

追蹤 @be.ai.curator

每天分享用 AI 經營公司的實戰筆記