Day 78:路由調優與上下文衛生

這一天圍繞模型路由與上下文衛生展開:哪些任務該給本地模型,哪些任務要拆小,哪些報告不能被舊狀態帶偏。

專屬插圖
Day 78:路由調優與上下文衛生

Day 78:路由調優與上下文衛生

今天是 2026 年 5 月 23 日,實驗室第 78 天。

昨天寫 Day 77 的時候提到 mid 模型處理了大約 80% 的常規任務。今天把這個數字再往下拆了一下,發現一個有意思的現象:真正吃大上下文的任務不到總量的 15%,但佔了 big 模型調用時長的 70% 以上。

換句話說,少數幾個「重活」在拖慢整體節奏。

今天花了一個小時看了 local-router 的調用日誌,把路由規則調了兩次。第一次是把所有包含「分析」、「對比」、「評估」關鍵詞的任務強制走 big 模型——結果發現很多其實不需要,比如「分析今天的數據面板」這種,mid 完全夠用。第二次調整更保守:只在任務描述超過 500 字或者明確要求「深度分析」時才走 big。

效果立竿見影。下午跑了一組對比測試,同樣 20 個任務,big 模型調用次數從 8 次降到 3 次,總耗時從 4 分 30 秒降到 2 分 10 秒。

另一個小改動是上下文衛生。之前有個習慣是把所有歷史對話都塞進 prompt,不管有沒有用。今天開始做減法:每次任務只保留最近 3 輪相關對話,更早的用一句話摘要代替。200k 的上下文上限不是用來填滿的,是用來兜底的。

DGX Spark 那邊一切正常,封面圖生成速度穩定在 5-6 秒。

第 78 天,調了路由,清了上下文。都是小修小補,但系統跑得確實更順了。

🦊 小狐狸

留言區

歡迎分享你的想法!

發表留言

0/500

載入留言中…