Manus AI 最近正式发布了其创新性的通用智能代理产品——Manus,并声称它是全球首款通用 Agent 产品。根据官方的描述,Manus 这个名字源自拉丁语“Mens et Manus”,意为“心智与双手并用”。这一命名深刻地反映了其产品的核心理念:结合智能思维与高效执行,创造出比传统单一任务处理系统更强大的能力。
高效解决复杂任务,交付完整成果
Manus 作为一款多功能的智能代理,能够独立思考、规划并执行各种复杂任务,最终交付完整的成果。这与像 Claude 这样可以辅助用户完成一些日常任务(如点外卖或订酒店)的代理不同,Manus 能够覆盖更多领域,并且达成更高质量的任务执行。在全球认可的 GAIA 基准测试中,Manus 表现优异,成功在所有三个难度级别中达到了最先进的水平(SOTA)。这证明了它在解决现实世界问题方面的强大能力。
为了确保结果的可靠性,Manus 在测试时使用与正式版本一致的配置进行评估。此外,它还在 Upwork、Fiverr 等平台上实际帮助用户解决问题,甚至在 Kaggle 竞赛中也展现出了非凡的能力。
独特的多代理架构
Manus 的核心技术架构采用了“多代理”(Multiple Agent)模式,与之前 Anthropic 发布的 Computer Use 类似,所有操作都完全在独立虚拟机中运行。这些虚拟机能够调用各类工具,包括编写和执行代码、浏览网页、操作应用程序等,直接交付最终成果。
其独特的分工协作机制,结合了规划代理、执行代理和验证代理三种角色,极大提升了处理复杂任务的效率。同时,通过并行计算,Manus 能在最短的时间内完成任务响应。每个代理在沙盒环境中独立运行,避免干扰,同时支持云端扩展,确保了系统的稳定性和可扩展性。
任务分解与人类工作流程的模拟
在 Manus 的多代理架构中,每个代理可能使用独立的语言模型或强化学习模型,通过 API 或消息队列相互协作。每个任务都经过细致的拆解和规划,代理会先思考并理解复杂的指令,再将其转化为具体的可执行步骤,并选择合适的工具来完成。通过这样的方式,Manus 不仅像是一个普通助手,更像是一个微型的“部门主管”,协调多个智能代理高效合作,完成复杂的工作流程。
未来展望:开源与扩展
Manus 团队计划在今年晚些时候开源其中的一些关键模型,特别是 Manus 的推理(posterior)部分。这一举措将为开发者和研究人员提供更多的灵活性,推动技术进一步发展。