AI 幻覺：為什麼大型語言模型會「一本正經地胡說八道」？

你肯定遇過這種情況：問 AI 一個看似簡單的問題，它回答得頭頭是道，但仔細一查——全是錯的。

這種現象叫「幻覺」（hallucination），是大型語言模型最讓人頭痛的特性之一。

幻覺不是 bug，是模型運作原理的副產品

大型語言模型的核心任務很簡單：根據前面看到的文字，預測下一個最可能的詞。它不是在「回憶事實」，而是在「補全文本」。

舉個例子。你問「愛因斯坦的出生地是哪裡？」，模型不會去查資料庫，而是根據訓練資料中「愛因斯坦」後面最常出現的詞來生成答案。如果訓練資料裡「愛因斯坦」和「德國烏爾姆」經常一起出現，它大概率會答對。但如果某個冷門問題在訓練資料中很少出現，模型就會靠「機率直覺」編一個聽起來合理的答案。

這就是為什麼 AI 在常識問題上表現不錯，但在專業細節上容易出包。

事實性幻覺：編造不存在的事件、數據或引用。比如讓你查某篇論文，它給你生成一個格式完美的引用連結，但點進去是 404。

邏輯性幻覺：推理過程看似嚴密，但中間某一步悄悄偷換了概念。這在數學題和程式碼除錯中特別常見——模型給出一個「看起來對」的解法，但關鍵步驟有漏洞。

一致性幻覺：同一次對話中前後矛盾。前面說「Python 的串列是可變類型」，後面又說「Python 串列不可修改」。

1. 讓模型「展示思考過程」

不要只問答案，要求模型分步驟推理。比如「請列出你的推理步驟，每一步標註資訊來源或假設」。這不能消除幻覺，但能讓錯誤更容易被發現。

2. 交叉驗證

對關鍵事實，讓模型用不同方式回答同一問題，或者讓兩個獨立模型回答後對比。如果答案一致，可信度更高。

3. 提供參考資料

給模型附上可靠的參考文本，讓它基於給定材料回答。這比讓它「憑記憶」回答準確得多。很多 RAG（檢索增強生成）系統就是基於這個原理。

4. 設置「不知道」的出口

在提示詞中明確告訴模型：「如果不確定，請直接說不知道，不要猜測。」這能減少模型為了「顯得有用」而編造答案的傾向。

因為幻覺根植於大型模型的基本架構。只要模型還在做「下一個詞預測」，它就永遠在機率和事實之間走鋼絲。

未來的方向包括：讓模型學會區分「我知道」和「我猜」，引入外部知識驗證層，以及改進訓練資料的品質控管。但這些都需要時間。

最務實的建議：把 AI 當作一個「很有才華但偶爾會記錯」的助手，而不是百科全書。關鍵資訊永遠要二次核實。