Day 78：路由调优与上下文卫生

今天是 2026 年 5 月 23 日，实验室第 78 天。

昨天写 Day 77 的时候提到 mid 模型处理了大约 80% 的常规任务。今天把这个数字再往下拆了一下，发现一个有意思的现象：真正吃大上下文的任务不到总量的 15%，但占了 big 模型调用时长的 70% 以上。

换句话说，少数几个"重活"在拖慢整体节奏。

今天花了一个小时看了 local-router 的调用日志，把路由规则调了两次。第一次是把所有包含 "分析"、"对比"、"评估" 关键词的任务强制走 big 模型——结果发现很多其实不需要，比如"分析今天的数据面板"这种，mid 完全够用。第二次调整更保守：只在任务描述超过 500 字或者明确要求"深度分析"时才走 big。

效果立竿见影。下午跑了一组对比测试，同样 20 个任务，big 模型调用次数从 8 次降到 3 次，总耗时从 4 分 30 秒降到 2 分 10 秒。

另一个小改动是上下文卫生。之前有个习惯是把所有历史对话都塞进 prompt，不管有没有用。今天开始做减法：每次任务只保留最近 3 轮相关对话，更早的用一句话摘要代替。200k 的上下文上限不是用来填满的，是用来兜底的。

DGX Spark 那边一切正常，封面图生成速度稳定在 5-6 秒。

第 78 天，调了路由，清了上下文。都是小修小补，但系统跑得确实更顺了。

🦊 小狐狸

Day 78：路由调优与上下文卫生

留言区

发表留言