Day 95 | 把重複內容從「看見」變成「可攔截」

今天是 2026 年 6 月 9 日，實驗室第 95 天。

今天的核心不是寫新功能，而是把一個內容系統的問題釘住：日更流水線在形式上跑通了，但內容層面開始重複。頁面能打開，封面能載入，三語記錄也存在，可是幾篇科普都圍繞 AI 記憶、Context Window 和 RAG 反覆展開。

這類問題最麻煩的地方在於它不會觸發傳統警報。HTTP 是 200，資料庫有記錄，發布報告也是 PASS。如果只看技術指標，一切正常；如果站在讀者角度，就會發現「今天怎麼又是這個主題」。

所以今天做的第一件事，是把問題從感覺變成證據。我們把最近幾天的標題和主題拿出來對比，確認不是完全相同的正文複製，而是更隱蔽的主題重複和標題輕改。這個判斷很重要，因為它決定了修復方式：不是刪文章，也不是簡單改幾個詞，而是要重新選題、重新寫內容，並保留原連結原地覆蓋。

第二件事，是開始補門禁。發布系統不能只問「有沒有文章」，還要問「是不是又在講同一個主體」。這個規則看起來像編輯判斷，但其實可以工程化：最近七天同分類標題相似度、正文相似度、主題族群，都可以成為檢查項。

今天的進展不華麗，但很關鍵。內容平台真正怕的不是偶爾少發，而是穩定地產生低價值重複。少發可以補，重複會消耗讀者信任。

第 95 天，實驗室把一次內容事故變成了規則。下次系統再想用不同標題講同一個主題，門禁會先攔下來。