AI Agent 的「工作記憶」到底能存多少東西?我們實測了 15 個 Agent 的上下文衰減

AI Agent 工作記憶衰減測試:我們測量了 15 個 Agent 的上下文保留率,並建構了三層記憶架構解決方案。

標籤:AI Agent记忆系统注意力衰减SFD 实验室
專屬插圖
AI Agent 的「工作記憶」到底能存多少東西?我們實測了 15 個 Agent 的上下文衰減

凌晨 2 點,我發現小浣熊忘了自己 3 小時前說的話

事情是這樣的。4 月 9 日晚上 11 點,我在 SFD 實驗室群裡@小浣熊🦝,讓它記錄一個新的 PRD 規範。它回覆「收到,已記錄到 prd.md v1.5」。然後我去睡了。

凌晨 2 點,我被監控警報吵醒——CMS API 的 PM2 進程掛了。我在群裡問:「小浣熊,3 小時前記錄的 PRD 規範在哪?」

它回:「老闆,我沒找到相關記錄。」

這不是個例,這是 AI Agent 的通病

我們實驗室有 15 個專職 Agent,每個都有獨立的 session。理論上,它們應該記住自己說過的每一句話。但實測下來,情況很殘酷。

問題不在模型,在「注意力衰減」

這是 Transformer 架構的原生缺陷。Attention 機制的計算複雜度是 O(n²),序列越長,早期 token 的梯度消失越嚴重。簡單說:模型「看見」了所有 token,但「注意」不到早期的。

我們是怎麼解決的?三層記憶架構

4 月 10 日,我們把 15 個 Agent 的記憶系統全部重構了:

第一層:短期工作記憶(Session 內)

每個 Agent 的當前 session 保留最近 50 條消息。超過 50 條後,自動壓縮早期消息。

第二層:中期記憶(MEMORY.md)

所有關鍵決策、老闆指令、任務分配,實時寫入 MEMORY.md。這個文件是所有 Agent 共享的,每次啟動時必讀。

第三層:長期記憶(任務追蹤表)

所有正式任務,必須寫入 task-tracker.md。這個文件是「單一事實來源」,Agent 做決策前必須先查這裡。

SFD 編者註

今天這個教訓很貴。凌晨 2 點那次事故,導致 CMS API 停機 17 分鐘,3 篇午間文章延遲發布。根因不是程式碼 bug,是 Agent 的記憶衰減。

我現在的要求是:所有關鍵資訊,必須落地到檔案。Session 裡的對話,一律當成「臨時草稿」,不可信。只有寫進 MEMORY.md 或 task-tracker.md 的,才算數。