GPT-5.5 幻覺少了一半是真的，但對你的日常問題有差嗎？

如果你這幾天打開 ChatGPT，可能已經發現預設模型變成 GPT-5.5 Instant 了。根據 OpenAI 的說法這次的模型幻覺少了 52.5%。但這個數字到底代表什麼，對我們一般用戶有沒有差，以下我們就來一探究竟。

52.5% 是在哪種情況下測出來的

天秤左側放醫療、法律、財務圖示明顯較重，右側是信封與筆記本，象徵幻覺改善主要集中在高風險問題

這個數字來自 OpenAI 自己的內部評測，測試的是「高風險提示」，也就是醫療、法律、財務這三類問題。當你問 ChatGPT「這個藥和什麼藥不能一起吃」或「這份合約的這條條款合法嗎」，舊版的模型很容易給出聽起來有理、但其實不準確的答案，而且語氣充滿自信。

另一個數字是 37.3%，測的是「用戶曾標記為事實錯誤的困難對話」，這更接近真實使用的情況。

簡而言之，新模型確實比較不容易犯這類錯，大大減少了一本正經講幹話的機率。

你的日常問題裡，哪些最容易被幻覺坑

幻覺是 AI 語言模型的結構性問題：模型根據「聽起來合理」的模式生成文字，即使它實際上不知道答案。

有幾類問題特別容易踩到這個坑：

叫它提供來源或引用：這是風險最高的場景。問 ChatGPT「請推薦幾本關於 X 的書，附上作者和出版年份」，它給的書名可能存在，作者可能是真人，但兩者可能根本沒有關係。學術研究顯示，舊版 ChatGPT 生成的引用裡，有高達 47–55% 是捏造的。新版改善了，但你仍然需要自己去確認。
問具體的人名、事蹟、言論：某個人說了什麼話，某件事發生在哪一年，某位名人的經歷，這類問題的幻覺風險比問「怎麼寫信」高很多。
醫療和法律資訊：這是 OpenAI 這次改善最用力的地方，也是過去最危險的場景。

相比之下，你用 ChatGPT 寫信、改履歷、整理筆記、翻譯文字，幻覺幾乎不是問題。這類任務的內容是你自己提供的，模型只需要處理你給的資料，不需要從訓練記憶裡搜索事實。