xAI发布Grok3大语言模型号称世界最聪明AI市场看好但专家意见分歧

这不是投资建议，作者并未持有文中提到的任何股票。Wccftech.com 有信息披露和道德规范政策。

aibase-tech-elon-musk-grok-3-ai-1024x576

经过数日的造势，xAI 在埃隆·马斯克（Elon Musk）主持的直播中正式发布了其 Grok 3 大语言模型（LLM）。尽管 xAI 一直声称这款新的 LLM 是同类产品中表现最佳的，但一些专家指出，其发布的基准测试存在关键缺陷。

相关报道显示，xAI 正在将其 Colossus 超级集群的规模扩大一倍，达到 20 万块英伟达（NVIDIA）霍珀（Hopper）GPU。xAI 在 X 平台的帖子中表示，Grok 3 LLM 是“世界上最聪明的人工智能”。你可以通过 X 平台观看完整的演示视频。

有意思的是，埃隆·马斯克宣布，旧版的 Grok 2 LLM 将在几个月后开源。这一举措不禁让人联想到“DeepSeek 效应”。xAI 特别强调，Grok 3 LLM 在数学、科学和编程基准测试中超过了所有其他已公开发布的基础模型，包括 DeepSeek-V3 和 GPT-4o。此外，该 LLM 在 Arena 基准测试中取得了前所未有的 1402 分。

与此同时，Manifold Markets 关于 Grok 3 是否是世界上最强大的人工智能的投注合约，目前预计将以“是”结束。不过，支持方获胜的概率从周一晚间的 91% 下降至撰写本文时的 78%。这或许与围绕 Grok 3 的一些批判性评论有关，尽管这些评论数量不多，但可能对市场预期产生了影响。

例如，曾在 DeepSeek 工作过的Zihan Wang向 Grok 3 展示了一张两张大小不一的铁球挂在比萨斜塔不同高度的照片，并询问哪张球会先落地。按照常识，更重且更接近地面的球 A 应该先落地，但 Grok 3 的回答却是两个球会同时落地。这一结果引发了人们对 Grok 3 逻辑推理能力的质疑。

此外，许多人还质疑 xAI 为何没有公布 Grok 3 在 FrontierMath、Arc-AGI 或 HLE 基准测试中的得分。这些质疑并非是要贬低 Grok 3，毕竟它是一款非常强大的人工智能模型，而是为了探究 xAI 所声称的“同类最佳”是否名副其实。

另一方面，彭博社近期报道称，xAI 正在与现有投资者进行谈判，计划在新一轮融资中筹集高达 100 亿美元的资金，这将使这家初创公司的估值达到 750 亿美元。在上一轮融资中，xAI 以 400 亿美元的估值筹集了 60 亿美元。

最后，xAI 的Guodang Zhang披露，Grok 3 是在 10 万块 GPU 上训练的，并且未来还会使用更多 GPU。这也就不难理解，为什么 BESI 预测到 2032 年，销售人工智能芯片的收入将攀升至 2270 亿美元了。

搜索结果如下

阅读全文

xAI发布Grok3大语言模型号称世界最聪明AI市场看好但专家意见分歧

也可以看看

Epic表态不禁AI生成缩略图，称未来将更难检测

阅读全文

RX9060XT传闻反转，AMD显卡确认推8GB版本

阅读全文

雷朋Meta眼镜隐私条款更新，用户数据默认用于AI训练

阅读全文