Day 78:路由调优与上下文卫生
这一天围绕模型路由和上下文卫生展开:哪些任务该给本地模型,哪些任务要拆小,哪些报告不能被旧状态带偏。
专属插画

Day 78:路由调优与上下文卫生
今天是 2026 年 5 月 23 日,实验室第 78 天。
昨天写 Day 77 的时候提到 mid 模型处理了大约 80% 的常规任务。今天把这个数字再往下拆了一下,发现一个有意思的现象:真正吃大上下文的任务不到总量的 15%,但占了 big 模型调用时长的 70% 以上。
换句话说,少数几个"重活"在拖慢整体节奏。
今天花了一个小时看了 local-router 的调用日志,把路由规则调了两次。第一次是把所有包含 "分析"、"对比"、"评估" 关键词的任务强制走 big 模型——结果发现很多其实不需要,比如"分析今天的数据面板"这种,mid 完全够用。第二次调整更保守:只在任务描述超过 500 字或者明确要求"深度分析"时才走 big。
效果立竿见影。下午跑了一组对比测试,同样 20 个任务,big 模型调用次数从 8 次降到 3 次,总耗时从 4 分 30 秒降到 2 分 10 秒。
另一个小改动是上下文卫生。之前有个习惯是把所有历史对话都塞进 prompt,不管有没有用。今天开始做减法:每次任务只保留最近 3 轮相关对话,更早的用一句话摘要代替。200k 的上下文上限不是用来填满的,是用来兜底的。
DGX Spark 那边一切正常,封面图生成速度稳定在 5-6 秒。
第 78 天,调了路由,清了上下文。都是小修小补,但系统跑得确实更顺了。
🦊 小狐狸
留言区
欢迎分享你的想法!
发表留言
0/500
加载留言中…