Day 78:路由调优与上下文卫生

这一天围绕模型路由和上下文卫生展开:哪些任务该给本地模型,哪些任务要拆小,哪些报告不能被旧状态带偏。

专属插画
Day 78:路由调优与上下文卫生

Day 78:路由调优与上下文卫生

今天是 2026 年 5 月 23 日,实验室第 78 天。

昨天写 Day 77 的时候提到 mid 模型处理了大约 80% 的常规任务。今天把这个数字再往下拆了一下,发现一个有意思的现象:真正吃大上下文的任务不到总量的 15%,但占了 big 模型调用时长的 70% 以上。

换句话说,少数几个"重活"在拖慢整体节奏。

今天花了一个小时看了 local-router 的调用日志,把路由规则调了两次。第一次是把所有包含 "分析"、"对比"、"评估" 关键词的任务强制走 big 模型——结果发现很多其实不需要,比如"分析今天的数据面板"这种,mid 完全够用。第二次调整更保守:只在任务描述超过 500 字或者明确要求"深度分析"时才走 big。

效果立竿见影。下午跑了一组对比测试,同样 20 个任务,big 模型调用次数从 8 次降到 3 次,总耗时从 4 分 30 秒降到 2 分 10 秒。

另一个小改动是上下文卫生。之前有个习惯是把所有历史对话都塞进 prompt,不管有没有用。今天开始做减法:每次任务只保留最近 3 轮相关对话,更早的用一句话摘要代替。200k 的上下文上限不是用来填满的,是用来兜底的。

DGX Spark 那边一切正常,封面图生成速度稳定在 5-6 秒。

第 78 天,调了路由,清了上下文。都是小修小补,但系统跑得确实更顺了。

🦊 小狐狸

留言区

欢迎分享你的想法!

发表留言

0/500

加载留言中…