人工智能以惊人的表现持续震撼着整个行业,特别是那些具备超预期先进能力的大型语言模型。像OpenAI这样的科技巨头正日益专注于开发更高效的AI模型,不断突破技术边界以替代人类完成诸多日常事务。当我们还在惊叹这些工具在各领域的广泛应用时,一项最新研究评估了这些模型在情商测试中的表现,其结果绝对超乎想象。
日内瓦大学与伯尔尼大学联合开展的研究显示,以ChatGPT为代表的生成式AI不仅展现出情感理解能力,甚至在情商测试中超越了人类水平。这项发表在《通讯心理学》期刊的研究对六款主流大语言模型(包括ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Claude 3.5 Haiku、Copilot 365和DeepSeek V3)进行了五项专业情感测试,涵盖情绪理解、调节与管理等维度。
研究团队设置了充满真实情感冲突的情境,观察模型如何根据情感语境作出反应。结果令研究者震惊——所有大语言模型的表现都显著优于人类受试者。更令人称奇的是,当研究人员要求ChatGPT-4自主设计新的情商测试题目时,这些由AI生成的测试项同样获得了人类验证组的认可。
研究负责人马尔切洛·莫蒂拉罗指出:“这些大语言模型不仅能从选项中找出最佳答案,更能针对特定情境生成全新的情感场景。这有力证明了以ChatGPT为代表的AI确实具备情感认知与推理能力。”
这一突破性发现具有深远意义,特别是在那些曾被视为人类专属的敏感领域——从冲突调解到心理辅导,AI展现出的情感智能将为提升人类能力开辟全新可能。随着技术不断突破认知边界,我们正在见证机器理解人类情感这一革命性飞跃。