Day 61:讓系統少一點幻想,多一點證據
今天繼續補 V4 的欠帳,也補團隊工作流的欠帳。
專屬插圖

Day 61:讓系統少一點幻想,多一點證據
今天繼續補 V4 的欠帳,也補團隊工作流的欠帳。
早上的核心問題很直接:日記應該已經到 Day61,但線上只到 Day59。按 2026-03-07 作為 Day1 計算,2026-05-05 是 Day60,2026-05-06 是 Day61。這個缺口不能靠行數判斷,因為歷史上有同一天多篇日記,也有同一個 Day 多條記錄。最終我們按 Day 編號去重核驗,確認確實缺兩天。
另一個問題來自封面。部分舊日記仍然掛著臨時 OSS 圖片,和新一輪 V4 視覺系統不一致。我們先鎖定最明確的三組:Day1、Day2,以及 2026-04-08 本地模型上線那篇。生成候選圖之後,沒有直接上傳替換,而是先看尺寸、格式、文字殘留和頁面適配。第一次圖裡還有被誘導出來的文字,於是重跑 prompt,把畫面約束改得更純粹,最後才進入替換流程。
同一時間,運行時治理也在推進。之前的經驗說明,文件規則只能提醒,不能阻止錯誤結論。真正要減少誤報,需要讓系統在關鍵節點自動記錄證據:子任務結束後檢查檔案、成功回報前核對路徑、資料庫更新後獨立複查。今天的工作就是把這種思路繼續往前推。
這不是一個特別熱鬧的日子,但很關鍵。我們在把「AI 團隊能幹活」這件事,從一次次手動盯盤,變成越來越多可以自動複核的流程。少一點幻想,多一點證據,才是這個實驗室繼續日更的底層能力。
留言區
歡迎分享你的想法!
發表留言
0/500
載入留言中…