埃隆·马斯克(Elon Musk)旗下的人工智能公司 xAI 在周一晚间正式发布了其最新旗舰人工智能模型——Grok 3,并为 Grok 的 iOS 和网页应用程序带来了全新功能。

Cover Image

Grok 是 xAI 为应对 OpenAI 的 GPT-4o 和谷歌的 Gemini 等同类模型而打造的人工智能产品。它不仅可以分析图像,还能回答各种问题,并为马斯克的社交平台 X 提供多项功能支持。Grok 3 的开发历时数月,原本计划在 2024 年推出,但最终未能如期发布。

此次发布可谓雄心勃勃。xAI 在位于孟菲斯的超大型数据中心中,利用约 20 万个 GPU 对 Grok 3 进行训练。马斯克在社交平台 X 上表示,Grok 3 的开发使用了比上一代产品 Grok 2 高出约 10 倍的计算能力,并且训练数据集也得到了大幅扩展,涵盖了法庭文件等内容。

在周一的直播展示中,马斯克强调:“Grok 3 的能力比 Grok 2 高出一个数量级。它是一款追求极致真理的人工智能,即使这种真理有时会与所谓的‘政治正确’相冲突。”值得注意的是,Grok 3 实际上是一个模型家族。其中,Grok 3 mini 是一个较小的版本,它以牺牲部分准确性为代价,能够更快地回答问题。目前,Grok 3 的所有模型及相关功能尚未全部上线(部分功能仍处于测试阶段),但从周一开始已经逐步向用户开放。

xAI 宣称,Grok 3 在多项基准测试中表现优异,例如在 AIME(用于评估模型在数学问题上的表现)和 GPQA(通过博士级别的物理、生物和化学问题评估模型)测试中,Grok 3 的成绩超过了 GPT-4o。此外,Grok 3 的早期版本还在 Chatbot Arena 测试中取得了具有竞争力的成绩。Chatbot Arena 是一项众包测试,通过让用户对不同人工智能模型的回答进行投票,来评估模型的表现。

Grok 3 家族中的两款新模型——Grok 3 推理和 Grok 3 mini 推理,能够像 OpenAI 的 o3-mini 和中国人工智能公司 DeepSeek 的 R1 这样的“推理”模型一样,仔细“思考”问题。推理模型会在给出结果之前进行事实核查,从而避免一些常见的错误。

xAI 还表示,Grok 3 推理在多个流行基准测试中超过了 o3-mini 的最佳版本 o3-mini-high,包括一项名为 AIME 2025 的新数学基准测试。

这些推理模型可以通过 Grok 应用程序访问。用户可以选择让 Grok 3“思考”,或者对于更复杂的问题,启用“超级大脑”模式,借助额外的计算能力进行推理。xAI 认为,推理模型最适合用于数学、科学和编程问题。

马斯克提到,为了避免知识提取,Grok 应用程序中隐藏了一些推理模型的“思考”过程。知识提取是一种由人工智能模型开发者用来从其他模型中提取知识的方法。最近,DeepSeek 被指控通过提取 OpenAI 模型的知识来创建自己的模型。

Grok 的推理模型还支持 Grok 应用程序中的一个新功能——DeepSearch。这是 xAI 推出的一款人工智能驱动的研究工具,类似于 OpenAI 的深度研究工具。DeepSearch 可以在互联网和 X 平台上扫描信息,并在回答问题时提供摘要。

X 平台的 Premium+ 层级订阅用户(每月 50 美元)将率先获得对 Grok 3 的访问权限,而其他功能将被限制在一个名为 SuperGrok 的新计划中。据泄露信息显示,SuperGrok 的价格为每月 30 美元或每年 300 美元。该计划将解锁额外的推理和 DeepSearch 查询功能,并提供无限的图像生成功能。

马斯克还透露,Grok 应用程序将在未来几周内增加“语音模式”,为 Grok 模型提供合成语音。几周后,Grok 3 模型将通过 xAI 的企业 API 提供,并附带 DeepSearch 功能。

此外,xAI 计划在未来几个月内开源 Grok 2。马斯克表示:“我们的一般做法是,当新版本完全推出时,我们将开源上一个版本(Grok)。当 Grok 3 成熟且稳定后,这可能在未来几个月内实现,那么我们将开源 Grok 2。”

两年前,马斯克首次宣布 Grok 时,将其定位为一款尖锐、未经过滤且反“政治正确”的人工智能模型。它愿意回答其他人工智能系统不愿涉及的争议性问题。在这一点上,Grok 确实做到了部分承诺。例如,当被要求使用粗俗语言时,Grok 和 Grok 2 会欣然从命,说出一些你可能从未在 ChatGPT 中听到的“色彩斑斓”的语言。

然而,在 Grok 3 之前,Grok 模型在政治话题上有所回避,并不会跨越某些界限。事实上,一项研究发现,Grok 在跨性别权利、多元化项目和平等问题等话题上倾向于左倾。

马斯克将这种行为归咎于 Grok 的训练数据——公开网页,并承诺将“让 Grok 更接近政治中立”。目前尚不清楚 xAI 是否已经实现了这一目标,以及可能带来的后果。


文章标签: #人工智能 #Grok 3 #xAI #社交平台 #推理模型

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。