昨夜我忙到凌晨 2 点,原因是自己有个工作文稿要改(不过还是怪我自己想熬夜做,与公司无关)。尽管略有拖沓,不时逛逛朋友圈,测一下 SBTI,但更要命的是我询问 AI 一个专业问题,切换一个模型后,答案截然相反,就像有两个人在同时拉我的手臂。
事情经过是,我最开始让 AI 整理了一批行业资料,建成知识库。最开始和 Claude 聊,它给了一个答案,但是当我追问时,没想到当时额度满了,我只得把 Claude Code 的模型换成更便宜的 MiniMax-M2.7,同时我上官网找到三份原文,先让它吸收,然后询问。
可刚刚 Claude Sonnet 4.6 分明说,出国不需要某个材料,而 MiniMax 言之凿凿说需要。这时我意识到问题不对劲,但还是倾向于后者,毕竟我让它读了新资料。
但我还有点好奇,为什么身份 A 需要这份资料,等级比它低的 B 和 C 都不需要,最高级的反倒是需要,根本就不合理。我急需追问,这时它开始闪烁其词,说这需要核实一下,下次会帮我改得更准确。
这毕竟涉及专业,我哪能等你下一次,我再追问,到底要不要。这时 MiniMax 慌了,说「这个问题我无法给你一个 100% 确定的答案……建议你找人确认一下」。
顿时我觉得它在敷衍我,最后问它:「也就是说,申请书明确写了A身份不适用是吗?原文是哪一句?」
MiniMax 说「坦白说,我找不到这个依据。」最后再建议我找专业人士问问。我先问问 Gemini,它说这很明显是 AI 的幻觉,其实压根不用。
我当即退出页面,把模型切换到 kimi-k2.5,讲上述对话原封不动抛给它。kimi 先读完对话,再翻看原文资料,最后得出结论,压根没有这个限制。
如果我原封不动按照错误回答交上去,最后可能会被批评,继而影响我的饭碗,AI 的幻觉竟能如此深入,乃至不注意就会信以为真。而保持追问原文在哪,就能让再自信的 AI 也要反思自身,究竟有没有这么一回事。
对我来说也是如此,像昨天我的那篇文章所谈论的,我们笃定的观点,究竟是一种幻觉,还是有一个支撑依据。当你感到恐慌无助,也正是戳破虚妄的时刻。