这一天的前 23 个小时,在人类技术史上几乎没有任何进展。而一切重大的发展,都仅仅集中在这一天的最后 7 分钟。
还记得GPT刚问世时我改用过的传播学之父施拉姆的这段话吗?
不好意思,现在我要再次把它拿出来。因为全球首款通用 AI Agent(自主智能体)产品「Manus」已经问世了。
中国团队出品的产品,原本深耕海外市场,在权威的 GAIA 基准测试中创下新纪录,其性能远超 OpenAI 的同类产品,这些都将 Manus 的话题性拉满。
圈外人还在对 AI Agent 式术语以及“年度最炸裂 AI 应用”类大词感到迷惑时,圈内人已经纷纷开始寻求邀请码了。
Manus 致使许多 AI 圈的人士难以入眠,很多专业人士在技术论坛中寻求邀请码。
现实情况如下:Manus 成为了另一个在国外技术论坛上频繁出现的带有中国印记的 AI 产品,此前有一个被某些人称作“国运级科技成果”的 DeepSeek。
我即便对“生成式 AI 的 iPhone 时刻”“Agent 的 GPT 时刻”这类大词已不再有感觉。看着演示视频里,Manus 能够自主分析 15 份简历,最终 Excel 排名表生成的速度,比喝完一杯美式咖啡还要快。这样的景象,仍让我不免有些震颤。
奈何自己没文化,只能一句「厉害」走天下。
我和 Manus 存在“校缘”方面的关联。Manus 背后的 Monica.im 创始人肖弘(英文名 Red),与我是校友,不过我们都毕业于华中科技大学。我和他相隔甚远,仿佛隔了 N 个银河系,并且没有利益上的关联。
01
问题来了:Manus到底厉害在哪?
DeepSeek 擅长处理单线程任务,比如合同审查。Manus 能够并行完成“爬取财报→编写 Python→部署网站”这样的复杂链路。
DeepSeek 在 3 个月内实现了 10 倍的推理效率提升。Manus 在 GAIA 基准测试中,把任务拆解的颗粒度细化到了“0.1 秒级决策”。
DeepSeek 专注于模型层,而 Manus 已构建了多智能体协作沙盒,并且宣布在年底开源部分模型,这就如同 Android 早期利用开放生态来对抗 iOS 的策略,简直如出一辙。
看不太懂,是不是?
看不懂就对了,这是DeepSeek说的,我也不懂。
作为0.5个小白,我想说些在我理解范围内的东西。
Manus已引发众多国外科技媒体的关注。
很多人知晓,在这两年间,“Agent”这个词十分火爆。“Agent,将成为下一个爆款级的 AI 应用”的说法出现了;“Agent,会是下一代入口级的机会”的说法也有了;“Agent,将会取代 App”的说法四处流传。
大模型就如同 AI 的大脑,而 Agent 则像是 AI 的助理贾维斯,这种表述最为形象。
去年年底,中国通信院云计算与大数据研究所的所长何宝宏指出,在 2025 年,Agent 将会成为焦点。“大模型的七年之痒正在显现。接下来,我们必须要从大模型转变为 Agent,并且 Agent 是具有目标导向性的,这与大模型的知识压缩属性是不同的。”
在他的观点中,AI 大模型角力的“下半场”有一个标志。这个标志就是内容生成开始转向智能体(Agent)框架(AutoGPT)。并且,这种转向能够支持工具调用(API)、进行任务规划以及实现动态交互。与此同时,Agent 正在崛起。
那,何以Agent?
OpenAI 的前副总裁翁荔先前已经给出了一个公式,这个公式受到了业内的广泛认可,该公式为:Agent 等于大模型加上记忆再加上主动规划以及工具使用。
可以这样说,AI 要从“想象力”这个阶段迈向“生产力”这个阶段,而 Agent 是一个非常好的能够起到连接作用的东西,就如同云梯一样。
这两年,Agent 概念较为火热。然而在现实当中,在绝大部分的场景里,打工人依然需要自己亲自去进行工作流的定义以及编排。
[id_1467033728]
这时候,Manus用手指着自己身上的标志。那标志是“全球首款通用型 Agent”。接着,他说了一句:要不,试试我这个?
02
「通用」,意味着什么?
技术人士或许会抛出一连串术语:要做到全链路交付,即能够直接执行到产出结果;要实现云端异步,也就是可以在云服务器自动工作,完成后再通知用户;要保证数据可靠,会自动调用权威的 API,而不是随意使用不知名的数据源;要擅长进行代码调用,会自己编写代码来调用不同的工具,以完成数据可视化。
这几乎是对着Manus演示视频做总结了。
Manus官方发布的演示视频。
已经有人对Manus的特点,做出了具象化的概括:
1,强大的工具调用能力
Manus 具备听懂你需求的能力,同时还能够直接调用诸如浏览器、代码编辑器、数据分析工具等各种工具,它可以直接帮你把任务完成,并且直接给你成品。
2,独立运行的计算环境
Manus 是“云上打工仔”,它拥有自己的独立计算环境。你无需一直盯着它去干活,这样非常省心。
3,类似人类同事的协作体验
你随时可以调整任务方向,中途改变需求,而 Manus 能够灵活应对,不会出现“卡壳”的情况。不仅如此,它还能记住你的偏好,下次会直接按照你的喜好来,用起来会越来越顺手。
4,多领域任务处理能力
Manus 是“全能王”。它在教育方面能轻松搞定;在金融领域能轻松搞定;在旅行方面能轻松搞定;在编程方面能轻松搞定;在数据分析方面也能轻松搞定。它可以帮你进行深度调研,能够帮你整理文件,还能够帮你进行可视化分析,甚至能够根据你的需求生成个性化内容,像旅行手册、研究报告、代码等。
5,持续优化与学习能力
Manus 会持续学习并且进行优化。你能够利用它的知识系统增添自身的要求,也可以让它记住某一种工作方式,以便下次能够直接使用。
Manus描绘出了一幅“mens et manus”(知行合一)的景象。这景象也是其名字的由来。
老实说,被贾老师PPT伤害过的我,对此仍要持谨慎采信态度。
但只要Manus能兑现演示视频中的一半,就已足够强大了。
03
也许在某些人看来,Manus压根算不上颠覆性创新。
在网络上,有一种流行的说法。这种说法是:套壳达到极致的情况,既可以是 TPF,也可以是 PMF,并且最终都会通向用户价值。
言下之意,Manus终归是套壳。
Manus 不算冤枉:Manus 身后的 Monica 是靠 AI 插件领域头部产品发家的。她或是通过独立开发者产品 GPT for Google 完成冷启动,或是在去年 GPT-4o、Claude 3.5 上线的第一时间帮用户接入最新 SOTA(技术最先进)模型,又或是通过 DIY Bot、Artifacts 来写小程序、具备记忆等功能,这些都表明 Monica 是个“超级缝合怪”。
但这不意味着,作为应用层突破的Manus,没有技术创新。
Manus 在权威的 GAIA 基准测试里创造了新的纪录,它的性能比 OpenAI 的同类产品要远远超出很多。
布莱恩·阿瑟在《技术的本质》中说过:新技术并非凭空被“发明”出来。技术是从先前已有的技术中创造而来,具体包括:一是被构建;二是被聚集;三是被集成。
他认为,技术的进化呈现出“自创生”的特点。并且,新技术的产生,都是源自其他技术的“组合进化”。
即使 Manus 并非模型层的创新,也不能否定它在技术方面具有突破性。
事实上,DeepSeek 代表了模型创新。此前,它被认为只是造出了“30 美元 iPhone”而已。
结果是大家都能看到的。带动中国资产价值重估,意味着对多头潜在注意力(MLA)、群组相对策略优化(GRPO)技术以及稀疏激活网络(MoE)架构等创新进行了盖章确认。
Manus亦如是。
美团、滴滴都是应用创新,应用创新也是创新。
04
从业内的反应来看,有不少人对于 Manus 给技术方面所带来的价值已经做出了预判。
就我来说,我更想从更普适的角度去谈谈其更深远的价值。
它把硅基与碳基的“物种级差”拉平了许多,并且将二者之间的挡板削掉了很大一部分。
GPT 出现之后,许多人都表示:生成式 AI 技术具备很强的颠覆性以及很强的嵌入式特点,能够以较低的成本应用到众多的行业之中。
这使得有些人期盼它的提效作用,也有人忌惮它的替代效应。
纳西姆·塔勒布曾说过,在各种职业里,90%的人是无知的,他们依靠情境模仿、狭隘的模仿以及半意识的角色扮演来开展工作。社会科学领域有 99%的人是这样,新闻业更是 100%的人如此。
但两年过去了,不论是提效还是替代,都没很多人想的那么猛烈。
AI和人,差的绝不只是弄懂「鱼头指谁」的能力。
科技观察家元正老师认为,人并非特殊的存在,而真正特殊的是算力。瓦特、麦克斯韦、爱因斯坦所代表的是生物算力的算力奇点,等同于人体智能超算;GPT 则是以机器算力为主导的,属于“生物+机器”混合算力的算力奇点,其水平约等于机器智能超算。
过去推动社会进步的是人体智能超算。机器智能超算无法做很多人类能做的工作,原因在于它还不够“智能”。
可王兴兴用行动说:真的吗?尔后甩出了人形机器人。
具身化,让AI跟人更像了一些。
但高盛显然还有些不服。
这几天,高盛的分析师团队对宇树科技进行了调研。他们认为,宇树科技最强大的人形机器人 H1 仅具有 19 个自由度(DoF)。这表明,它尚不具备处理复杂且精细任务的能力。
它觉得,在未来的 2 到 3 年时间里,人形机器人难以达到和人类工人一样的工作效率。而有意义的应用,或许得在 5 到 10 年的时间跨度中才会显现出来。
那,要是宇树H1+Manus呢?
可以肯定的是,至少离抵达图灵奇点更近一步了。
如果把 GPT 看作是“生物+机器”混合算力奇点的第一阶段产物,那么 DeepSeek 会将其不断推向远方,人形智能机器人也会如此,Manus 同样会把它推向更远的地方。
05
从 DeepSeek 到 Manus,会让人想起一句话。这句话是:科技群星闪耀时。
诸多迹象似乎也表明:2025,是科技大爆发之年。
茨威格在《人类群星闪耀时》中写道:“个人的一生以及历史的进程中,充满戏剧性且命运攸关的时刻是难得的。这种时刻往往仅在某一天出现,或许某一小时,甚至某一分钟,然而它们所产生的决定性影响却能跨越时间。”
有为法皆如此,就像 DeepSeek 开始面世,就像 Manus 开始问世,应当以这样的视角去看待。
作者 | 佘宗明
运营| 李玩
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://www.mjgaz.cn/fenxiang/274778.html