最近 Manus 迅速走红。很多人都因为没有邀请码而感到苦恼,只能眼睁睁地看着拥有邀请码的人去体验那种“别人给自己干活”的快感。
为什么这东西会如此吸引人呢?原因在于如今的大语言模型只能与你进行“言语交流”。当你对它说“这个东西我不会”时,它会为你列出详细的步骤,然而却绝对不会帮你完成。完成工作这件事,只有碳基生物能够做到,硅基生物是做不来的。
Manus 一出现,就展现出了超越传统大模型的自主执行能力。它不但能够理解复杂的指令,而且还能够拆解任务以及调用工具等。网友一看,发现这简直就是一个可以帮自己打工的私人助理。
这东西并非全能,只能被称作“套壳产品”。它虽然集成了很多工具包,但倘若遇到其工具库里没有的情况,那就糟糕了。
比如,你能否让 Manus 帮你进行 PS 图像处理呢?能否让它用 PR 来剪辑视频呢?然后能否把相关工程文件发给你呢?对不起,做不到这些。也就是说,它距离我们真正的“生产力工具”还存在很大差距。
但最近世超于 GitHub 上发现了一个较为热门的项目,此项目能够让大语言模型帮你进行建模。这是一件非常了不起的事情,可以说是让 AI 成为真正生产力工具的关键一步。如今,这个项目已经获得了 6.8k 的 Stars ,并且还在持续快速地增长。
世超把演示视频看完了。他发现作者仅仅通过和 Claude 进行对话,就借助 3D 建模软件 Blender 构建出了一幅很精美的模型。在整个建模过程中,既不需要敲代码,也不需要学习软件的操作,只需用语言描述需求就能够完成。
视频中,作者于对话框内直接输入:“请用 Blender 为我构建一个场景,其中有一条龙正站在一罐金子的旁边。”
Claude 随即开始使用 Blender 进行建模,速度很快。
最终成品图如下:
看着效果确实挺好的呀,那一定要去体验一下啦。毕竟我是个懒狗,看到别人把活都干完了,确实会有一种无法拒绝的快感呢。
我找到了项目文档,然后按照上面的步骤进行操作,不到一小时就把项目部署好了,这确实是很简单的。在整个过程中,我不需要写代码,仅仅通过鼠标操作就完成了。
体验了一个上午,先说结论:趣味性十足,实用性一般。
我首先进行了一次试验,想看看是否能够达到视频里的效果。我直接将视频中的提示词复制过来,接着他就真的列出了步骤,并且一步一步地开始做起了相关的事情。
就是这效果。。不能说是一模一样,只能说是有点关系:
金币和地板是有了,就是这龙也太龙了。
视频显示,作者在该提示词的基础上进行了多次微调。世超对建模一无所知,不懂得如何调整建模细节,因而导致实物与原图不相符。感兴趣的差友们可以试着复刻一下视频中的效果。
来个简单点的吧,给我画条龙。我们来看看对于这种简单直接的要求,它的完成情况是怎样的。
于是,我直接跟它说:给我画条真龙。
看它输出的步骤,样子很有章法。先是画出龙身,接着画出龙头,之后是画出龙爪以及进行细节修饰。
结果呢?
你别说,这条龙和楼上那条龙有着相似的妙处。看来大模型对于龙的理解就是如此,既像龙又像猪。没关系,毕竟都属于十二生肖。
真龙无法画出来,那奶龙可以吗?我会把奶龙的所有细节特征都详细地给你描述清楚,然后你给我画,这样就不会出现错误啦。
需要动手去画。要画一条黄色的怪兽,它的头是圆圆的,身躯是肥胖的,胳膊和腿都很短,还有恐龙那样的尾巴以及绿色的眼睛。
它立马就开始动手了,很快啊。
最终结果令我拍手叫好:
实话实说,在给它的几个任务当中,这个任务的完成度是最高的。至少可以明显看出来它已经像是一条奶龙了。
这些实际上都是神秘的东方元素,西方大模型画不出是可以理解的。
是否有在世界各地都较为常见的东西呢?我进行了思考,接着让它为我绘制一栋房子。提示的内容很是简单,就是画一栋房子。
在经过一番全自动操作后,它给出了最终成品:
嗯,确实还可以。这里有门,有窗,有树,甚至还有烟囱之类的东西。只是旁边飞着两根横梁,不知道它们是用来做什么的。
这几轮体验过后,感觉只是勉强可以。因为是零基础建模师,所以能建出能看出形状的模型就已经算是取得胜利了。
世超将自己的作品展示给专业 3D 建模的同事。同事指出:目前世超仅仅具备简单几何体堆砌的能力,就如同小孩搭积木那般,尚不具备建立复杂模型的能力。
有很多网友尝试过它之后,也给出了类似评价:
总结而言:可以使用,但也仅仅只是能够使用。若要给专业人士提供帮助,实际上还差得很远。
但就现在 AI 的发展而言,这是一个相当大的进步。AI 从之前“无法摸到工具”的状态转变为“能够摸到工具”了,那么 AI 给人类打工这件事还会遥远吗?
话又说回来,不是说让 AI 实现工具使用有难度吗?这是如何实现的呢?
其实,AI 如何使用我们的生产工具来干活,一直是 AI 从业者所研究的难题。因为现今的 AI 与生产力工具们,还不能够直接进行“交流”。
《圣经》中提到,最初所有人类使用的是同一种语言。为避免人类合伙建造通天塔,上帝下达命令,将大家的语言分隔开来。
现在的各大 AI 与人类的工具以及数据库之间存在着这种“语言不通”的矛盾。 现在的各大 AI 与人类的工具存在着“语言不通”的矛盾。 现在的各大 AI 与人类的数据库存在着“语言不通”的矛盾。
去年 11 月,为了解决这个问题,一位重量级嘉宾登场了,这位嘉宾叫 MCP(Model Context Protocol,模型上下文协议)。
它是 Anthropic 提出的一种开放标准协议,你可将其理解为 AI 世界的“翻译官”。无论你是什么,只要支持 MCP 协议,它就能让大模型的“语言”被其他使用 MCP 协议的工具听懂。如此一来,壁垒被打破,通天塔指日可待。
如果未来有越来越多的应用采用 MCP 协议,那么我们的 AI 就能够便捷地调用这些应用来开展工作,如此一来,人类就可以正式迈入“解放双手”的时代了。
上面介绍的建模项目使用了 MCP 协议,将大模型与建模软件连接在一起。因此,我们每提出一个要求,大模型就能够依据该要求调用建模软件并执行相应操作。
时间不断推移,已经有不少工具加入到 MCP 的队伍当中了。
比如,有一个叫 Cline 的插件在 VSCode 上,它本身是借助 AI 来辅助编程的,并且最近宣布支持 MCP 了,这就表明这款插件能够使用 MCP 生态所包含的全部功能。
有一款名为 Firecrawl 的爬虫工具,它能够将各大网站的信息进行抓取,接着把这些信息转化为对大模型友好的 Markdown 格式。
程序员使用这款插件时,希望在网站上抓取一些有用的信息,然后将其喂给 AI 进行总结,这是非常容易的。
据传 Manus 未使用 MCP 协议,世超认为若未来 MCP 成为主流,那么 Manus 就会随即失去意义。毕竟当大家都能实现“万物互联”时,就不需要这个集成工具包了。当然,这都还处于展望阶段,未来究竟会怎样,难以预料。
最近的几波新闻都表明,AI 与“替人类干活”的距离越来越近了。大家担心会被抢工作,这是很正常的,因为谁也无法预知下一个被替代的职业究竟是什么。
所以,你的职业离被 AI 拿下,还有多远呢?
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://www.mjgaz.cn/fenxiang/275012.html