这不是投资建议,作者并未持有文中提到的任何股票。Wccftech.com 有信息披露和道德规范政策。

aibase-tech-elon-musk-grok-3-ai-1024x576

经过数日的造势,xAI 在埃隆·马斯克(Elon Musk)主持的直播中正式发布了其 Grok 3 大语言模型(LLM)。尽管 xAI 一直声称这款新的 LLM 是同类产品中表现最佳的,但一些专家指出,其发布的基准测试存在关键缺陷。

相关报道显示,xAI 正在将其 Colossus 超级集群的规模扩大一倍,达到 20 万块英伟达(NVIDIA)霍珀(Hopper)GPU。xAI 在 X 平台的帖子中表示,Grok 3 LLM 是“世界上最聪明的人工智能”。你可以通过 X 平台观看完整的演示视频。

有意思的是,埃隆·马斯克宣布,旧版的 Grok 2 LLM 将在几个月后开源。这一举措不禁让人联想到“DeepSeek 效应”。xAI 特别强调,Grok 3 LLM 在数学、科学和编程基准测试中超过了所有其他已公开发布的基础模型,包括 DeepSeek-V3 和 GPT-4o。此外,该 LLM 在 Arena 基准测试中取得了前所未有的 1402 分。

与此同时,Manifold Markets 关于 Grok 3 是否是世界上最强大的人工智能的投注合约,目前预计将以“是”结束。不过,支持方获胜的概率从周一晚间的 91% 下降至撰写本文时的 78%。这或许与围绕 Grok 3 的一些批判性评论有关,尽管这些评论数量不多,但可能对市场预期产生了影响。

例如,曾在 DeepSeek 工作过的Zihan Wang向 Grok 3 展示了一张两张大小不一的铁球挂在比萨斜塔不同高度的照片,并询问哪张球会先落地。按照常识,更重且更接近地面的球 A 应该先落地,但 Grok 3 的回答却是两个球会同时落地。这一结果引发了人们对 Grok 3 逻辑推理能力的质疑。

此外,许多人还质疑 xAI 为何没有公布 Grok 3 在 FrontierMath、Arc-AGI 或 HLE 基准测试中的得分。这些质疑并非是要贬低 Grok 3,毕竟它是一款非常强大的人工智能模型,而是为了探究 xAI 所声称的“同类最佳”是否名副其实。

另一方面,彭博社近期报道称,xAI 正在与现有投资者进行谈判,计划在新一轮融资中筹集高达 100 亿美元的资金,这将使这家初创公司的估值达到 750 亿美元。在上一轮融资中,xAI 以 400 亿美元的估值筹集了 60 亿美元。

最后,xAI 的Guodang Zhang披露,Grok 3 是在 10 万块 GPU 上训练的,并且未来还会使用更多 GPU。这也就不难理解,为什么 BESI 预测到 2032 年,销售人工智能芯片的收入将攀升至 2270 亿美元了。


文章标签: #人工智能 #大语言模型 #基准测试 #专家质疑 #市场预期

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。