Manus的出现并非偶然,而是AI Agent技术演变的自然结果。这个演变过程令人着迷,就像看着一个孩子从学走路到独立生活的过程(图2-6)。
图2-6 AI Agent 的进化历程
第一代:学会使用工具(Function Calling)
想象一个刚学会使用简单工具的孩子。OpenAI的Function Calling就像是给AI提供了一套积木和使用说明书。
AI可以按照指示使用工具,但仍需要人类持续引导每一步。就像你教导孩子搭积木:“拿起红色积木,放在蓝色积木上,再拿绿色积木……”
这一代AI Agent的关键特点:
● √首次让AI能调用外部工具和API;
● √能接触真实世界数据;
● ×每个行动都需要人类指导;
● ×无法自行规划多步骤任务。
第二代:学会与工具融洽相处(MCP)
如果说Function Calling让AI学会了使用单个工具,Anthropic的MCP则创造了一个标准化的学习环境,就像一所设备齐全的学校。
在这个阶段,AI学会了如何更高效地与各种工具交互,但仍主要是响应式的,就像一个能按照详细指导完成作业的学生。
这一代AI Agent的关键突破:
● √统一了工具访问标准;
● √提高了AI与多种工具协作的能力;
● √增强了不同AI系统间的互操作性;
● ×仍然缺乏高级自主性和主动性。
第三代:独立思考与行动(Manus AI)
Manus代表了真正的飞跃——从被动的助手到主动的代理人。这就像看着一个孩子成长为能独立解决复杂问题的成年人。
Manus不仅知道如何使用工具,还知道何时使用哪些工具,如何组合使用它们,以及如何根据情况调整策略。这种能力源于其多模型架构和自我改进机制。
这一代AI Agent的革命性特性:
● √能理解高级目标并自主规划实现路径;
● √会主动寻找并使用最合适的工具;
● √像人类团队一样协调不同“思维模式”;
● √能监控自己的进度并进行调整;
● √对意外情况有适应能力。
三代技术比较:从助手到伙伴的旅程
比较三代技术的特性(表2-8)。
表2-8 技术的特性
Manus的局限与未来展望
尽管Manus令人印象深刻,但它并非完美。目前的局限包括:
● 处理高度创意任务时偶尔会出现平庸结果;
● 处理极其复杂或模糊指令时可能需要额外澄清;
● 在快速变化的环境中可能需要更频繁的人工干预。
我认为这些挑战正是未来发展的关键方向。随着技术的进步,我们可能会看到以下几个方面的发展。
● 更精细的多模型协作机制: 允许更复杂的“思维团队”配置。
● 更强的元认知能力: 让AI能更好地了解自己的局限并寻求帮助。
● 更自然的人机协作模式: 在AI自主性和人类控制之间取得更好的平衡。
● 思考未来: 从工具到伙伴。
Manus AI的出现让我思考一个更深层次的问题:AI正在从我们使用的工具变成与我们合作的伙伴。这种转变可能会重新定义我们的工作方式、创造方式,甚至是思考方式。
思考问题: 如果你有一个像Manus这样的AI伙伴,你会如何重新安排你的工作和创造过程?哪些任务你会委托给它,哪些你会选择亲自完成?
动手尝试: 想象一个你经常处理的复杂任务(如项目规划、研究报告或创意工作)。尝试写下你希望一个自主AI Agent如何帮助你完成这个任务的详细说明。这个练习可以帮助你了解AI Agent如何融入你的工作流程。
随着我们从讲述AI Agent的技术基础转向探索其实际应用,下一章将深入研究Manus及类似系统如何在现实世界中创造价值。让我们一起探索这个令人兴奋的新领域!