AI Agent领域的“复刻”与创新:深度解读Manus与OpenManus

吸引读者段落: 凌晨三点,代码敲击声在寂静中回荡;次日清晨,数百条好友申请蜂拥而至;GitHub上,星星数量以惊人的速度攀升……这是Manus,这款爆红AI Agent的真实写照。它仿佛一颗耀眼的新星,迅速点燃了整个AI Agent领域。然而,更令人瞩目的是,仅仅三天后,国内AI初创公司DeepWisdom旗下的MetaGPT团队便完成了对Manus的复刻,并将其开源版本OpenManus发布,引发了业界热议。这究竟是简单的技术复制,还是一场蓄谋已久的技术超越?MetaGPT团队的技术实力究竟如何?OpenManus与Manus之间又存在哪些差异?本文将深入探讨这场AI Agent领域的“复刻风暴”,为您揭开背后的技术逻辑、行业意义以及未来发展趋势。让我们一起拨开迷雾,探寻AI Agent的无限可能,洞察这场技术竞争的深层脉络,感受技术革新带来的震撼与惊喜!这不仅仅是一次简单的技术复刻,更是一场关于创新、效率、开源精神以及未来AI Agent发展方向的深度思考。

Manus与OpenManus:一场技术“复刻”背后的故事

Manus的横空出世,无疑为沉寂已久的AI Agent领域注入了一剂强心针。其强大的规划能力、流畅的交互体验以及在GALA Benchmark评测中取得的SOTA(State-of-the-Art,当前最佳)成绩,使其迅速成为行业焦点。然而,DeepWisdom的MetaGPT团队却在短短三天内完成了对Manus的复刻,并将其命名为OpenManus,并在GitHub上开源。这不禁让人好奇:MetaGPT团队是如何做到如此快速高效的?这背后又隐藏着哪些技术秘密?

MetaGPT团队成员向劲宇和梁新兵向我们解释了这其中的奥妙。他们表示,这并非简单的“抄袭”,而是基于MetaGPT团队多年在多智能体框架研究上的技术积累。早在2023年,MetaGPT团队就开始专注于多智能体框架的研究,并开源了相关代码,积累了丰富的经验和技术沉淀。2024年10月,他们更是深入探索了Agent的规划能力和工具使用能力,并完成了Data Interpreter等关键性工作。因此,当Manus爆红之后,MetaGPT团队迅速意识到,他们完全有能力开发一个类似的产品。

OpenManus作为类Manus的多智能体框架,为开发者提供了快速上手和定制化开发的平台。然而,向劲宇也坦诚地指出,目前的OpenManus仍处于demo级(演示版本),尚未进行GALA benchmark评测,效果还有待提升。团队后续将继续投入DeepResearch方向以及SWE(软件工程)代码方向的研发,以进一步完善产品功能和性能。

与Manus相比,OpenManus最大的特点在于其开源属性。Manus的技术架构主要依靠用户猜测,而OpenManus团队则在项目致谢中明确指出了所参考的技术,例如Anthropic公司去年上线的computer-use以及YC投资的项目browser-use等。OpenManus作者张佳钇也公开总结了产品成果,并将其归纳为computer-use、基本的Agents以及规划能力的结合。

值得一提的是,虽然OpenManus在功能上与Manus相似,但两者在技术实现细节上存在差异。向劲宇推测,Manus团队在规划和后训练方面投入了大量的精力,才能够实现如此流畅的交互体验。而OpenManus目前尚未达到Manus的水平,这反映出在AI Agent开发中,后训练和规划能力的重要性。

多智能体框架:AI Agent发展的未来方向

Manus的爆红,不仅让更多人了解了AI Agent,更重要的是,它凸显了Multi-Agent(多智能体)架构在AI Agent领域的重要性。梁新兵认为,Manus的成功,放大了Multi-Agent这条路径,为其未来的发展注入了新的活力。

Multi-Agent的概念并非新事物,其雏形最早可以追溯到20世纪80年代,与分布式人工智能理念的兴起密切相关。然而,直到2017年大型语言模型技术成熟之后,AI Agent才真正开始从理论走向实践。AutoGPT的出现,则标志着AI Agent的雏形诞生。

进入2024年,微软、谷歌、苹果、OpenAI等科技巨头纷纷布局AI Agent市场。OpenAI在2025年1月发布了首款AI Agent产品Operator,具备执行复杂操作的能力,但仅面向付费用户提供。直到Monica公司推出了Manus,才让普通大众第一次直观地感受到了Multi-Agent的魅力。而MetaGPT团队随后开源的OpenManus,更是进一步揭开了Multi-Agent的神秘面纱。

AIGCLINK发起人、行行AI合伙人占冰强指出,Manus这类产品并非MetaGPT团队的首创,他们也是国内最早投入智能体研发的团队之一。

AI Agent面临的挑战与解决方案

MetaGPT NLP/Agent方向研究员洪思睿表示,目前利用大模型或Agent使用工具已经不再新奇。行业的技术难点在于:如何让Agent在众多相似的工具中做出最佳决策。此外,如果接入的工具接口不标准,或者工具参数出错,都可能导致工具执行效果不理想。

为了解决这些问题,业界正在积极探索各种解决方案:

  • 动态路由技术: 优化工具选择和使用过程。
  • 知识增强与幻觉抑制: 提升决策的可靠性。
  • 推理框架: 例如ReAct、Chain-of-Thought(CoT)和Tree-of-Thoughts(ToT),帮助Agent更清晰地展示决策过程。

MCP协议(Model Context Protocol,模型上下文协议)的出现,为解决上述问题提供了一种新的思路。MCP是由Anthropic于2024年11月底推出的一种开放标准协议,旨在统一大型语言模型(LLM)与外部数据源和工具之间的通信。通过标准化接口,LLM可以安全高效地访问外部资源,从而扩展其功能。占冰强认为,MCP协议的兼容性良好,关键在于技术厂商是否愿意支持。目前海外主流厂商已逐步接入,相信国内厂商也会陆续跟进。

常见问题解答 (FAQ)

Q1: Manus和OpenManus的主要区别是什么?

A1: 最大的区别在于OpenManus是开源的,而Manus是闭源的。这使得开发者可以更深入地了解OpenManus的技术架构,并基于此进行二次开发。此外,在功能和性能上,目前OpenManus仍处于demo阶段,与Manus相比还有一定的差距。

Q2: MetaGPT团队是如何在如此短的时间内复刻Manus的?

A2: 这并非简单的复刻,而是基于MetaGPT团队在多智能体框架领域多年的技术积累和经验。他们早已开展相关研究,并积累了丰富的技术储备。

Q3: 多智能体框架的优势是什么?

A3: 多智能体框架可以将复杂任务分解成多个子任务,并分配给不同的Agent执行,从而提高效率和可靠性。它更灵活,更适应复杂任务场景。

Q4: AI Agent目前面临哪些挑战?

A4: 主要挑战包括:如何优化工具选择和使用、如何提高决策的可靠性、如何处理非标准的工具接口以及如何更好地展现决策过程。

Q5: MCP协议的作用是什么?

A5: MCP协议旨在统一大型语言模型与外部数据源和工具之间的通信,从而提高LLM访问外部资源的效率和安全性。

Q6: OpenManus的未来发展方向是什么?

A6: MetaGPT团队计划进一步完善OpenManus的功能和性能,并投入更多资源到DeepResearch方向以及SWE(软件工程)代码方向的研发中。

结论

Manus的爆红以及MetaGPT团队对OpenManus的迅速开源,标志着AI Agent领域进入了一个新的发展阶段。多智能体框架将成为AI Agent发展的核心技术,而解决工具选择、决策可靠性和接口标准化等问题,将成为未来研究的重点。开源精神和技术共享将进一步推动AI Agent技术的进步和普及,最终为我们带来更加智能、便捷的AI体验。 相信在不久的将来,我们将看到更多基于多智能体框架的AI Agent应用涌现,并深刻地改变我们的生活和工作方式。 这只是AI Agent发展历程中的一个缩影,未来还有更广阔的空间等待我们去探索!