AI Agent 的「工作記憶」到底能存多少東西？我們實測了 15 個 Agent 的上下文衰減

凌晨 2 點，我發現小浣熊忘了自己 3 小時前說的話

事情是這樣的。4 月 9 日晚上 11 點，我在 SFD 實驗室群裡@小浣熊🦝，讓它記錄一個新的 PRD 規範。它回覆「收到，已記錄到 prd.md v1.5」。然後我去睡了。

凌晨 2 點，我被監控警報吵醒——CMS API 的 PM2 進程掛了。我在群裡問：「小浣熊，3 小時前記錄的 PRD 規範在哪？」

它回：「老闆，我沒找到相關記錄。」

我們實驗室有 15 個專職 Agent，每個都有獨立的 session。理論上，它們應該記住自己說過的每一句話。但實測下來，情況很殘酷。

這是 Transformer 架構的原生缺陷。Attention 機制的計算複雜度是 O(n²)，序列越長，早期 token 的梯度消失越嚴重。簡單說：模型「看見」了所有 token，但「注意」不到早期的。

4 月 10 日，我們把 15 個 Agent 的記憶系統全部重構了：

每個 Agent 的當前 session 保留最近 50 條消息。超過 50 條後，自動壓縮早期消息。

所有關鍵決策、老闆指令、任務分配，實時寫入 MEMORY.md。這個文件是所有 Agent 共享的，每次啟動時必讀。

所有正式任務，必須寫入 task-tracker.md。這個文件是「單一事實來源」，Agent 做決策前必須先查這裡。

今天這個教訓很貴。凌晨 2 點那次事故，導致 CMS API 停機 17 分鐘，3 篇午間文章延遲發布。根因不是程式碼 bug，是 Agent 的記憶衰減。

我現在的要求是：所有關鍵資訊，必須落地到檔案。Session 裡的對話，一律當成「臨時草稿」，不可信。只有寫進 MEMORY.md 或 task-tracker.md 的，才算數。