上周刚刚推出预览版的“代理型”人工智能平台Manus,引发了比泰勒·斯威夫特演唱会还要热烈的炒作。Hugging Face的产品负责人称赞Manus是他“尝试过的最令人印象深刻的AI工具”,人工智能政策研究员迪恩·鲍尔(Dean Ball)则称其为“使用人工智能的最复杂的计算机”。Manus的官方Discord服务器在短短几天内就吸引了超过13.8万名成员,其邀请码甚至在中国二手应用闲鱼上以数千美元的价格出售。

Cover Image

然而,这种炒作是否合理,目前还很难说。Manus并非完全从零开始开发。据社交媒体上的消息,该平台结合了现有的经过微调的人工智能模型,包括Anthropic的Claude和阿里巴巴的Qwen,用于执行撰写研究报告和分析财务文件等任务。但在其官网,Manus背后的中国初创公司蝴蝶效应(Butterfly Effect)却给出了该平台能够实现的一些夸张示例,比如购买房产、开发电子游戏等。

在X平台上的一段病毒视频中,Manus的研究负责人Yichao “Peak” Ji暗示该平台优于OpenAI的深度研究(Deep Research)和Operator等代理型工具。他声称,Manus在一项名为GAIA的通用人工智能助手基准测试中表现优于深度研究,该测试主要考察人工智能通过浏览网页、使用软件等方式完成工作的能力。纪一超表示:“Manus不仅仅是一个聊天机器人或工作流,它是一个完全自主的代理,弥合了构思和执行之间的差距。我们认为它是人机协作的下一个范式。”

不过,一些早期用户对Manus的评价并不高。人工智能初创公司Pleias的联合创始人亚历山大·多里亚(Alexander Doria)在X平台上发帖称,他在测试Manus时遇到了错误信息和无限循环。其他用户也指出,Manus在回答事实性问题时会出错,且并不总是引用其工作来源,甚至经常遗漏一些很容易在网上找到的信息。

Manus的一位发言人通过私信向媒体表示:“作为一个小团队,我们的重点是不断改进Manus,打造真正能帮助用户解决问题的人工智能代理。当前封闭测试的主要目标是压力测试系统的各个部分并找出问题。我们非常感谢大家提供的宝贵意见。”

那么,为什么Manus会在技术表现未达预期的情况下引发如此大的关注呢?主要有几个原因。首先是邀请码的稀缺性带来的排他性。中国媒体也迅速将Manus誉为人工智能领域的突破,QQ新闻称其为“国内产品的骄傲”。与此同时,社交媒体上的人工智能影响者传播了大量关于Manus能力的不实信息。一段被广泛分享的视频显示,一个桌面程序(据称是Manus)在多个智能手机应用程序中操作,但纪一超后来证实,这并非Manus的演示。

此外,X平台上的其他有影响力的人工智能账号试图将Manus与中国人工智能公司DeepSeek进行比较,但这些比较并不一定基于事实。与DeepSeek不同,蝴蝶效应并没有自主研发模型。而且,尽管DeepSeek公开了许多技术,但蝴蝶效应目前尚未公开。

公平地说,Manus目前还处于早期访问阶段。该公司声称正在努力扩大计算能力,并解决报告中提到的问题。但就目前而言,Manus更像是一个炒作跑在技术创新前面的案例。


文章标签: #人工智能 #Manus #DeepSeek #技术 #初创公司

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。