OpenAI新模型幻觉率飙升，原因成谜，性能突破伴随隐忧

菠萝老师先生 | 2025年4月23日

分类： 人工智能 | 1 分钟 | 486 个字

OpenAI（开放人工智能研究中心）近日发布的全新o3与o4-mini推理模型引发了广泛关注。这两款新模型不仅在性能上大幅超越前代o1和o3-mini版本，更具备“图像思维”能力以及智能组合多种AI工具完成复杂任务的技术突破。

值得注意的是，据TechCrunch报道，OpenAI内部测试数据显示，新模型的“幻觉”发生率呈现反常增长趋势。在人工智能领域，“幻觉”特指模型生成看似合理但完全失实的信息。例如当用户向ChatGPT（聊天生成预训练转换器）提出问题时，系统可能给出与事实严重偏离的答案。

具体测试数据显示，在评估人物话题事实准确性的PersonQA（人物问答）基准测试中：

o3模型的幻觉率达到33%

o4-mini更是高达48%

作为对比，旧版o1和o3-mini的数值分别为16%与14.8%

这种技术迭代过程中的性能退步现象引发行业关注。虽然幻觉效应在某些创意场景中可能无害，但当AI助手被应用于医疗咨询、法律建议等准确性敏感领域时，错误信息的产生将直接影响系统可信度。OpenAI发言人表示，技术团队正在全力排查原因，并承诺将持续提升模型的事实准确性与输出可靠性。

文章标签： #AI模型 #幻觉率 #OpenAI #性能突破 #准确性

负责编辑

菠萝老师先生

让你的每一个瞬间都充满意义地生活，因为在生命的尽头，衡量的不是你活了多少年，而是你如何度过这些年。

也可以看看

程序员用压缩炸弹反击爬虫，恶意机器人遭遇数据核爆

2025年5月2日 | 2 分钟 | 596 个字
分类：软件

程序员迪亚洛用压缩炸弹防御恶意爬虫，46MB文件解压后达4.5PB，可瘫痪攻击者服务器。他制作1MB和10MB两种炸弹，通过200 OK响应诱使机器人解压，耗尽对方内存。

阅读全文

assets/iztHhh6i622g6R3Xym8BFo-1920-80.jpeg

尼古拉斯凯奇新心理惊悚片冲浪者，烂番茄高分引爆期待

2025年5月2日 | 2 分钟 | 901 个字
分类：影视

洛肯·芬尼根执导、尼古拉斯·凯奇主演的心理惊悚片《冲浪者》获烂番茄好评。影片讲述冲浪者与儿子被海滩团伙驱逐后陷入疯狂，深刻探讨男子气概危机与社会压力。

阅读全文

assets/nicolas-cage-the-surfer.jpeg

22年时光淬炼，琳赛·罗韩完美重塑辣妈角色

2025年5月2日 | 2 分钟 | 849 个字
分类：影视

经典身体互换喜剧《辣妈辣妹》续集《更辣星期五》定档2025年，琳赛·罗韩与杰米·李·柯蒂斯再度合作，罗韩以母亲身份重新诠释角色。

阅读全文

assets/still-from-freakier-friday.jpeg