谷歌旗下人工智能研发实验室DeepMind宣布开发出新型AI系统AlphaEvolve,专门解决具有“机器可评分”特性的问题。该实验室表示,在实验中这套系统能够优化谷歌用于训练AI模型的部分基础设施。公司正在构建与之交互的用户界面,并计划在全面推广前先向选定学者开放早期体验计划。

Cover Image

当前多数AI模型存在“幻觉”问题——由于其概率架构特性,这类模型时常会自信地编造内容。事实上,OpenAI的GPT-4o等新一代AI模型出现幻觉的频率甚至高于前代产品,这显示出该问题具有相当的复杂性。

AlphaEvolve引入的防幻觉机制核心是自动评估系统。该系统通过模型生成、筛选并汇集问题的多种可能答案,随后自动评估这些答案的准确性并打分。DeepMind强调,AlphaEvolve专为领域专家设计使用。

这并非首个采用该策略的系统。数年前DeepMind团队等研究人员已在多个数学领域应用过类似技术。但DeepMind声称,AlphaEvolve通过采用“尖端”模型(特别是Gemini系列),其性能远超早期AI系统。

使用AlphaEvolve时,用户需提交问题描述,可选填指令说明、方程式、代码片段及相关文献等细节。同时必须提供以公式形式呈现的答案自动评估机制。由于系统仅能解决可自我评估的问题,其适用范围限于计算机科学系统优化等领域。另一主要局限是AlphaEvolve仅能以算法形式描述解决方案,因此不适合非数值类问题。

在基准测试中,DeepMind让系统尝试了涵盖几何到组合数学等领域的50道精选数学题。结果显示,AlphaEvolve在75%的情况下能“重新发现”已知最优解,并在20%的案例中找出更优方案。

实际应用测试包括提升谷歌数据中心效率及加速模型训练等方面。据实验室数据,AlphaEvolve生成的算法平均可回收谷歌全球计算资源的0.7%。系统提出的优化方案还将Gemini模型整体训练时间缩短了1%

需要说明的是,AlphaEvolve并未实现突破性发现。在某项实验中,系统对谷歌TPU AI加速芯片设计的改进方案,实际早被其他工具标记过。但DeepMind与其他AI实验室持相同观点:AlphaEvolve能节省时间,让专家专注于更重要的研究工作。


文章标签: #人工智能 #数学优化 #DeepMind #算法 #科技

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。