AI Agent就像是各式各样的数字生物,它们有不同的“栖息地”——有些住在你的浏览器里,有些住在你的计算机里,还有些住在云端的大型服务器中。让我们看看这些AI Agent有什么特点。
住在浏览器里的AI小精灵
浏览器就像是现代人的第二个办公室,我们在这里搜索信息、购物、工作、学习……而基于浏览器的AI Agent就像是在这个“办公室”里默默工作的小精灵,随时准备帮你处理各种任务。
它们能做什么? 从自动填表、抓取网页数据、总结长文章,到检查语法错误、提供智能搜索建议,这些小助手无所不能。你可能已经在不知不觉中用着它们了!
比如当你用Chrome浏览器时,AI已经悄悄融入其中:它会根据你的历史记录智能搜索、用Google Lens识别图片,甚至生成个性化的浏览器主题。
基于浏览器的AI Agent示例见表2-3。
● HARPA AI: 它能理解网页内容并回答你的问题,就像有个小助手在网页旁边随时待命。
● Automa: 用可视化方式创建自动化工作流,即使不懂编程也能让浏览器自动执行重复任务。
我特别喜欢的是能自动填写表单的扩展,它们仿佛能读懂我的心思,在我开始注册新网站时就自动填好了所有信息。这种小确幸真的能让数字生活变得更轻松!
表2-3 基于浏览器的 AI Agent 示例
坐在你桌面上的AI管家
如果说浏览器中的AI Agent是小精灵,那么桌面客户端形式的AI Agent就像是功能更强大的管家,它们拥有自己的“房间”(应用程序),能提供更专业、更深入的帮助(表2-4)。
这些AI管家能帮你做什么?
● 会议记录和转录: Notta和Otter.ai能自动记录会议内容,甚至总结关键点,让你告别疯狂记笔记的日子。
● 邮件管理: 想象有个助手能帮你筛选重要邮件,自动回复常见问题,还能总结长邮件的要点。Clean Email和Shortwave就是这样的存在。
● 内容创作: Jasper和Copy AI能根据简单提示生成各种文本,从博客文章到营销文案,大大加速创作过程。
● 任务管理: Trevor AI和Motion等工具不只是列出你的待办事项,还能帮你安排最佳时间,甚至预测哪些任务可能延期。
我观察到的一个有趣现象是,越来越多传统软件巨头正在将AI功能整合进他们的产品中。以Adobe和Microsoft为例,他们的软件已全面引入了AI助手,能帮你编辑图片、生成内容或自动化复杂任务。这标志着我们正在进入一个新时代,AI不再是单独的工具,而是所有软件的一部分。
表2-4 AI 驱动的桌面生产力应用示例
掌控你手机的AI精灵
智能手机已经成为我们的“第三只手”,而能控制智能手机的AI Agent就像是这只手的“大脑”,让我们用语音就能完成各种操作(表2-5)。
从Siri到小艺: 苹果公司的Siri可能是最知名的移动AI助手,但其他公司也不甘示弱。华为公司的小艺(海外称Celia)、小米公司的小爱同学,都在努力成为你手机上的完美助手。有趣的是,这些AI助手各有“性格”——Siri更像是专业助理,小爱同学则更活泼可爱。
最激动人心的进展是像智谱清言这样的AI已经具备了直接操控手机界面的能力,它不仅理解你的语音指令,还能模拟单击、滑动等触控操作。当你说“帮我订一张明天去上海的机票”时,AI不只是回答“好的”,而是自动打开订票APP,填写信息,完成预订流程!
表2-5 移动 AI 助手比较
云端的AI超级大脑
让我们把目光投向“云端”——那些运行在强大服务器上的AI Agent。如果说浏览器和桌面中的AI是个人助手,那么云端的AI就像是拥有超级计算能力的专业顾问团队。
AI云端的特征:
● 强大的计算能力,可以处理大量数据;
● 能够同时服务多个用户;
● 可以与其他系统和服务无缝集成。
以下是一些引人注目的例子。
● OpenAI的Computer Use: 这是一项实验性功能,支持AI直接与计算机界面交互,就像一个远程操控你计算机的数字助手。
● Claude终端访问: 如同有一位懂编程的助手随时待命,帮你分析代码、搜索资料、处理文件。
● 企业级自动化AI: 这些强大系统能自动执行从客户服务到供应链管理的全业务流程。
值得思考的是,随着这些云端AI变得越来越强大,我们与计算机交互的方式可能会发生根本性变化。未来我们也许不再需要学习如何使用软件,而只需告诉AI我们想要什么,它会帮我们搞定一切。