
你花了很多時間學怎麼跟 AI 說話。
下載了一堆提示詞範本,學習了各種提示詞架構,但總覺得距離「建立一個懂你的 AI 團隊」這個目標越來越遠。每次開一個新對話,從頭解釋你是誰、你要什麼、格式怎樣 —— 覺得自己好像一個複製貼上機器?
在 2026 年,AI 絕對有能力自己跑完一整個任務。但如果你每次都在空白視窗裡從零開始,再厲害的提示詞也救不了。
問題不在提示詞。問題在你沒有幫 AI 建好工作環境。
便利貼 vs 辦公室
差別有多大?想像給 AI 一張便利貼 vs 一間辦公室。
你在便利貼上寫「幫我做月報」,跟你給新人一張桌子、一台電腦、公司的 SOP 手冊、上個月的報告範本 —— 產出品質能一樣嗎?
便利貼 = 每次對話從頭開始。 辦公室 = 你把背景、規則、範例、工具一次設定好,之後 AI 每次都記得。
這個「從便利貼升級到辦公室」的過程,業界叫它 Harness Engineering(環境工程)。
你的 AI 工具,其實已經準備好了
很多人不知道,現在 ChatGPT、Claude、Gemini 都已經內建了「辦公室」功能。一個完整的工作環境有三個基礎設施:
1. Instructions(工作說明書)
告訴 AI 你是誰、你要什麼格式、什麼不能做。ChatGPT 在 Project Instructions 裡設定,Claude 在 Projects 裡設定,Gemini 用 Gems。
2. Knowledge(參考資料)
上傳公司 SOP、過去的報告範本、品牌指南。AI 每次對話都自動參考,不用你手動貼。
3. Tools(工具連接)
ChatGPT 可以連 Google Drive,Claude 支援 38 種以上的 Connectors(Notion、Slack、Jira⋯),Gemini 用 @ 叫出 Gmail、Drive、Calendar。
Claude Code:辦公室可以自己進化
如果你已經在用 Claude Code,能做的事遠不止「設定說明書」。真正把 Harness 跟「好的提示詞」拉開差距的,是以下四個功能形成的自我進化迴路:
CLAUDE.md —— 工作說明書
不要寫成百科全書。100 行以內當目錄就好,索引你的資料夾架構,讓 AI 需要時自己去讀。
Skills —— 工作流程的 SOP
教一次,打包成技能檔,下次遇到類似任務自動觸發。你也可以寫組合型技能,把多個技能串成自動化工作流。
Memory —— 跨對話記憶
不是「記住你叫什麼」那種單一對話記憶。是從上次犯的錯中學習、下次自動避開的機制。跨對話、跨天、持續進化。
Hooks —— 自動品管
AI 每次動作後系統自動檢查:寫完程式碼自動跑測試、產出文案自動品質審查。不用自己盯,系統有一道自己的防線。
把 Harness 建到位,成果有多誇張
OpenAI — 開發新產品時的內部實驗
3 個工程師用 Codex(AI 程式助手)開發 5 個月,交出一百萬行程式碼、1,500 個 PR —— 零行手寫。關鍵不是 Model 比較強,是 Harness 建到位:100 行的說明書當目錄索引、每次改動自動跑程式碼檢查、AI 自己截圖驗證結果。

OpenAI 官方文章:Harness Engineering
Stripe — 全球線上支付龍頭
內部做了一套叫 Minions 的 AI 系統。每週超過一千筆程式更新由 AI 完成 —— 工程師在 Slack 按一個表情符號就觸發。出錯了?自動回滾。全靠寫進 Harness 的規則和檢查機制。
Anthropic — Claude 的開發公司
Claude Code 自己就用兩階段 Agent 架構:先規劃再執行。透過 JSON 鎖住計劃防止 AI 偷改、檔案傳遞跨對話狀態。單次任務獨立運作超過 6 小時。

Anthropic 官方文章:Effective Harnesses for Long-Running Agents
共同點:都不是因為 Model 更強,是把規則、檢查、回饋全部建進了工作環境。
今天就開始你的第一步
1. 認清差距 —— 你跟 AI 之間的瓶頸不是提示詞寫得不夠好,是它每次都在空白的房間裡從零開始。
2. 馬上行動 —— 打開你最常用的 AI 工具 → 寫好 Instructions → 上傳參考資料 → 連接工具。下一次對話就生效。
3. 持續進化 —— 進階用 Claude Code 加上 Skills + Memory + Hooks,讓 AI 從錯誤中學習、自動檢查、越用越準。
延伸閱讀
本文的研究基礎來自以下原始文章,推薦深入閱讀:
