Day 78：路由調優與上下文衛生

今天是 2026 年 5 月 23 日，實驗室第 78 天。

昨天寫 Day 77 的時候提到 mid 模型處理了大約 80% 的常規任務。今天把這個數字再往下拆了一下，發現一個有意思的現象：真正吃大上下文的任務不到總量的 15%，但佔了 big 模型調用時長的 70% 以上。

換句話說，少數幾個「重活」在拖慢整體節奏。

今天花了一個小時看了 local-router 的調用日誌，把路由規則調了兩次。第一次是把所有包含「分析」、「對比」、「評估」關鍵詞的任務強制走 big 模型——結果發現很多其實不需要，比如「分析今天的數據面板」這種，mid 完全夠用。第二次調整更保守：只在任務描述超過 500 字或者明確要求「深度分析」時才走 big。

效果立竿見影。下午跑了一組對比測試，同樣 20 個任務，big 模型調用次數從 8 次降到 3 次，總耗時從 4 分 30 秒降到 2 分 10 秒。

另一個小改動是上下文衛生。之前有個習慣是把所有歷史對話都塞進 prompt，不管有沒有用。今天開始做減法：每次任務只保留最近 3 輪相關對話，更早的用一句話摘要代替。200k 的上下文上限不是用來填滿的，是用來兜底的。

DGX Spark 那邊一切正常，封面圖生成速度穩定在 5-6 秒。

第 78 天，調了路由，清了上下文。都是小修小補，但系統跑得確實更順了。

🦊 小狐狸

Day 78：路由調優與上下文衛生

留言區

發表留言