斯坦福大学2025年人工智能指数报告显示,在短短18个月内,高端人工智能大语言模型的调用成本从每百万token人民币144元(约合20美元)骤降至0.5元(约合0.07美元)。这份全景式呈现全球AI发展态势的年度报告同时指出,行业亟需建立更负责任的AI监管框架,而中美两国在AI新兴技术领域的竞争正日趋白热化。

Cover Image

斯坦福以人为本人工智能研究院(HAI)自2017年起每年发布AI指数报告,其研究成果屡获各国政府引用。该机构通过系统梳理AI领域多维数据,深入分析市场投资动向、技术应用热点与发展短板。最新报告不仅详实记录了2024年AI技术演进轨迹,更为未来发展趋势提供了前瞻洞察。

成本的双重悖论

人工智能模型使用成本在过去一年显著下降,但训练成本却逆向攀升。HAI研究附带的对比图表清晰呈现这一矛盾现象:尽管科技巨头持续加码旗舰模型研发投入,但模型运营与查询成本已大幅降低。

OpenAI(开放人工智能)、Meta(元宇宙平台)和谷歌(Google)最新旗舰语言模型的训练成本均呈现几何级增长。数据显示,这些企业最新AI模型的平均训练成本达到前代产品的28倍(其中Meta从人民币2176万(约合300万美元)增至1.23亿元(约合1.7亿美元),增幅最为显著)。新兴参与者如Mistral和xAI同样重金入局——Grok-2模型的训练成本预估达人民币7.7亿元(约合1.07亿美元)。

大语言模型训练成本短期内未见回落迹象。今年2月发布的Grok-3号称使用了十倍于前代的GPU算力,虽未公布具体造价,但业界推测其训练成本可能突破人民币72亿元(约合10亿美元)大关。

与天价训练成本形成鲜明对比的是,达到GPT-3.5级别性能(HAI定义为64.8%准确率)的模型调用成本在2022年11月至2024年10月间骤降280倍。中小型AI模型硬件与运营成本下降是主要推手——企业级AI硬件价格年降幅达30%,能效比提升40%。尽管头部企业将持续追加训练投入,但满足于GPT-3.5性能的用户将享受越来越低廉的使用成本。

中美技术竞逐新格局

自AI技术步入主流以来,美国始终保持着研发投入与技术表现的领先地位。但最新数据显示,中国正快速缩小差距。在行业基准测试中,中美顶尖大语言模型的性能差异已微乎其微。

LMSYS聊天机器人竞技场的双盲测试表明,美国最优模型仅领先中国最佳表现者1.7%。在MMLU和HumanEval等权威基准测试中,两国模型成绩也日趋接近,美国仅维持微弱优势。

数量维度上美国仍占据明显主导。在HAI统计的2024年度重要AI模型中,美国以40个入围作品遥遥领先,中国以15个位居次席,整个欧洲仅贡献3个模型。

AI安全隐忧加剧

HAI“负责任AI”章节揭示了不容忽视的技术风险。非营利组织AI事件数据库(AIID)统计显示,2024年有害AI事件报告数激增至233起,远超2023年的150起和2022年的100起。

报告列举了年度典型案例:防盗AI系统误判顾客为窃贼、深度伪造色情内容泛滥、聊天机器人诱导自残等恶性事件。值得注意的是,多数涉事AI企业拒绝承担事故责任,既不道歉也不提供赔偿。

完整版《2025人工智能指数报告》包含八大章节,涉及领域远超本文所述。在这个投资规模空前、边界持续拓展的行业,近期冲击现状的关税政策为尚处成长期的AI产业蒙上阴影。尽管技术前景仍充满未知,但人们期待未来数年能在AI训练与应用中看到更多安全与责任考量。


文章标签: #人工智能 #成本骤降 #中美竞争 #安全风险 #斯坦福报告

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。