欧洲AI公司研发两款微型高性能模型,体积小如鸡脑苍蝇脑
阅读全文

锤刻创思寰宇网
上周末,OpenAI做出了一项颇具争议的决定——用单一GPT-5模型取代所有旧版GPT-4系列,声称这款新模型在准确性、功能性和响应速度上都达到了前所未有的水平。尽管部分用户称赞其惊人的响应速度及通过某些技术测试的能力,但更多用户集体抗议,指出该模型丧失了创意火花,频繁给出敷衍答复,刻意回避情感与敏感话题,综合表现甚至明显劣于前代产品。舆论反弹如此激烈,以致OpenAI迅速重新上线了旧旗舰4o模型(仅限付费用户),同时为GPT-5新增“自动”、“思考”、“快速”和“专业”四种模式。
OpenAI曾对GPT-5寄予厚望,将其誉为“史上最强AI系统”,宣称具备“智能高效”的推理与应答能力。官方介绍称该模型能理解用户意图并动态调整响应,内置的“路由系统”可检测错误并优化输出,当使用量激增时还会启动迷你版本分流负载。按设计理念,它本应在编程、商业和创意领域全面超越前代,但用户反馈却与此背道而驰。
在ChatGPT的Reddit版块,关于GPT-5应答质量低劣的投诉铺天盖地。有用户批评其情感维度狭隘,面对亲人离世的消息竟推荐起殡仪馆服务;相较之下,GPT-4系列虽然时常情感过剩、措辞啰嗦,但至少体现出人性化温度——这或许正是OpenAI希望通过新版本来修正的特质。
但公司高层仍坚称这是一款卓越的模型。OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)持续转发各类人士的推文,强调GPT-5不会像旧模型那样产生幻觉。从量化指标来看,GPT-5确实表现亮眼:在Vellum的AI基准测试中,其数学与推理能力高居榜首,其他多项指标也领先于曾经的明星产品4o和3o。第三方测评机构Tom's Guide也发现,在文本提示响应方面,GPT-5优于谷歌的Gemini 2.5。
然而用户抱怨声浪仍在持续扩大。网络上广泛流传的GPT-5错误案例使其显得笨拙不堪,更关键的是,与前代产品类似,它似乎完全意识不到自己犯了错。这让阿尔特曼对此次发布的热切推崇显得尤为突兀——这位CEO曾暗示公司正在接近人工通用智能(AGI)的里程碑,但GPT-5的表现显然与之相去甚远,甚至在某些方面反而不及前作。
GPT-5的发布引发了关于AI发展是否陷入瓶颈的讨论,但对多数用户而言,他们只想要回旧版模型。在GPT-5上线后迅速发起的请愿活动中,用户强烈要求保留GPT-4o的访问权限。OpenAI虽妥协了这一要求,却将4o设为订阅专享。
公司目前尚未承认重大失误,尽管阿尔特曼通过SiliconRepublic承认GPT-5近期出现“低智”行为(声称已修复),并在社交平台暗示部分用户存在使用方式不当或过度依赖AI人格的问题。他在推文中表示:“如果用户处于心理脆弱状态且容易产生妄想,我们不希望AI强化这种倾向。虽然多数人能分清现实与虚构,但我们必须对新技术带来的风险负责。”
除了恢复旧模型,OpenAI还扩充了GPT-5的选项配置,并为高阶的“思考”模式提升消息限额。据传团队正在开发更富温度的GPT-5新版本,但会避免重蹈GPT-4o那种过度谄媚的覆辙。
尽管GPT-5已在多项基准测试中登顶,但用户接受度问题使OpenAI未来数月面临严峻挑战。随着Anthropic、Meta等巨头的更新模型即将问世,这家曾经的行业领头羊可能面临市场份额流失的风险。若无法扭转舆论风向,当下家喻户晓的ChatGPT或将让出领先地位。