这壁垒…… 一夜走红的 Manus,现在已经有了开源复刻版!
5 个人 3 个小时,一个完全免费、无需排队等待的 OpenManus 就做好了。
至于复现程度,还是直接看 Manus 官方和开源团队提供的 demo 对比。
作为全球首款通用智能体,官方提供的 case 如下:
而 OpenManus 团队三小时复刻的成果是酱婶儿的:
效果大家自己感受一下。
对于动手能力强的小伙伴儿,也期待大家自行体验后留言反馈。
从开源反推 Manus 的实现路径
与此同时,通过深扒 OpenManus,我们其实还可以看出一条实现 Manus 的合理路径。
(当前 Manus 使用了哪家模型、Agent 框架等具体细节处于保密状态)
概括而言,OpenManus 的背后有三大关键:
拥有模块化 Agent 系统;
具备实时反馈机制;
配备了一整套强大的工具链;
展开来说,其核心设计就在这种模块化 Agent 系统。开发者可以根据需要自由组合不同的功能模块,从而创造出独特的 AI 助手。
在 OpenManus 中,拥有不同分工的 Agent 会协作完成需求理解、规划、行动等任务。
比如 Manus 主代理就像项目经理,负责理解用户需求并完成分工;PlanningAgent 作为规划员,负责将复杂任务进一步拆解成可执行的步骤;而 ToolCallAgent 则是技术专家,负责掌管各类工具使用。
以上这一套都是靠开源团队曾经提出的 MetaGPT(一个多智能体框架)实现,开发者可以自由集成多个合适的大语言模型。
此外,OpenManus 的另一关键在于其思维过程是公开透明的。
正如开头提到的例子,拿到任务后,OpenManus 如何思考问题,如何规划执行…… 全都能实时反馈。
这为人类在合适时间进行干预提供了“窗口”,有助于更高质量完成任务。
最后不得不提到 Agent 对工具的使用。
为了完成复杂任务,OpenManus 也配备了一系列“外援”:
浏览器自动化:像人类一样操作浏览器,自动分析网络信息并交互;
各种代码执行器:能够实时生成和执行代码;
文件处理:自动生成和管理各类文档;
……
需要注意的是,各类工具都不是单独的模块,而是需要协同设计。
将以上组合在一起,这类多智能体系统的一般架构为:底层由各类大语言模型构成,中间层通过多智能体协作拆解任务,执行层调用各类 API 接口完成具体操作。
总之,按照 OpenManus 作者的总结,这一开源成果结合了 computer-use、基本的 Agents 以及融合了规划能力。
正如 OpenManus 团队在项目致谢中提到的,Claude 厂商 Anthropic 去年上线的 computer-use,以及 YC 投资的项目 browser-use,都给 OpenManus 提供了基础支持。
顾名思义,这两个项目分别被用来操作电脑和浏览器,而在沙盒环境中操纵正是 Manus 工作的一大核心特征。
5 人开发团队,3 小时完成复刻
OpenManus 团队只用了 1 个小时就完成了核心系统,整体也只用了 3 个小时。
核心作者梁新兵介绍,OpenManus 的火速上线,来源于 MetaGPT 积累下的技术沉淀。
(注:MetaGPT 是一个多智能体框架,为了处理复杂任务,将不同的角色分配给 GPT 模型,形成一个协作性“软件公司”。)
我们只是把浏览器工具链嫁接到过去代码上,配合沉淀的 Agent 工具包。
几位研发成员,也都是来自 MetaGPT 团队。
“开源版 Devin”—— 数据解释器(Data Interpreter),也是出自 MetaGPT 团队之手。
OpenManus 核心作者梁新兵,毕业于华东师大,还在读时就参与了 Data Interpreter 的工作。
另一名核心作者向劲宇,本科就读于西南交通大学应用物理系。
去年,读大四的他和队友一起使用 GPT-4 与 Claude 3 组成多智能体的方案,让 AI 分饰多个角色、相互验证来完成答题步骤,获得了阿里巴巴数学竞赛 AI 赛道全球第二名。
在 MetaGPT 社区,向劲宇还和其他成员一起,让智能体成功在“我的世界”当中采集到了钻石。
甚至他还曾经让智能体假扮知乎大 V,回答了 100 多个问题,获得 3 万余次阅读,还有赞同、反驳甚至私信关注,结果直到他主动停止,AI 的身份都未被发现。
张佳钇,去年本科毕业于中国人民大学高瓴人工智能学院,现在是港科大(广州)在读博士,被 ICLR 2025 接收的智能体框架 AFlow,他和向劲宇是共同一作。
于兆洋,张佳钇在人大的同级同学;洪思睿,MetaGPT 和 Data Interpreter 两篇论文的共同一作,DeepWisdom 高级研究员,香港科技大学硕士,本科毕业于暨南大学。
AFlow 的作者当中,也有于兆洋和洪思睿的名字。
今年,以张佳钇和向劲宇为共同一作,五个人的名字共同出现在了一个名为 SPO 的项目当中,该项目能够让提示词自我进化,让人们摆脱研究提示词工程的繁琐过程。
并且综合五名作者的经历和署名信息可以推断,除了 15 年取得硕士学位的洪思睿年龄稍长之外,其余 4 位作者,几乎都是本科毕业不久,当中有人选择继续深造,也有人加入了 DeepWisdom。
重新看 Manus“套壳风波”
除此之外,OpenManus 的出现,或许也给 Manus 的“套壳风波”提供了新的视角。
先简单回顾一下这场风波。
Manus 被质疑“套壳”主要源于两点:
一是有前车之鉴。Manus 背后团队曾打造出另一款产品 ——Monica,而作为一款集成各类大语言模型的插件,Monica 也曾一度陷入套壳争议。
所以对于一家公司出品的东西,大家很容易产生联想。
在此基础之上,由于产品被怀疑是套壳缝合而成,因此大家很容易形成 Manus 技术含量不高的印象。
然而,之所以说 OpenManus 是一个新视角,是因为从其复现路径来看,许多模块都是基于已有开源项目实现。
实现不同模块的统筹、调度,形成新的功能,绝非人人都有能力实现。
而且开源社区的一大意义,本就是让后来的开发者,能够直接站在巨人的肩膀上。
即使不谈开源,各大模型厂商提供 API 给开发者的目的,同样是让他们能够开发新的应用。
说得再夸张一些,引用 Perplexity 创始人的说法,“OpenAI 就是英伟达套壳,英伟达就是台积电套壳,台积电就是沙子套壳……”。
所以是否“套壳”,不是问题的核心,关键是它能不能产生实质性的生产力提升。
但从我们昨天的实测感受来看,Manus 距离这一目标,还有相当长的距离。
所以,把产品的能力打磨好,可能才是比纠结套壳更要紧的事。
你对 Manus 的感受如何?欢迎评论区留言讨论。
开源地址:
https://github.com/mannaandpoem/OpenManus
参考链接:
[1]https://x.com/didiforx/status/1897675038972883408
[2]https://www.sohu.com/a/827134153_121798711
[3]https://modelscope.cn/studios/AI-ModelScope/SPO
本文来自微信公众号:量子位(ID:QbitAI),作者:克雷西、一水,原标题《5 个人三小时复刻开源版 Manus,邀请码也不需要了》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。