让ChatGPT帮你写文案,让DeepL帮你翻译,用小浣熊自定义知识库进行问答......这些只是AI能力的冰山一角。当AI不仅能“回答”,更能“完整执行”复杂任务时,“AI Agent”便标志着智能工具迈入新阶段。
什么是AI Agent
Agent翻译过来就是“代理”,而AI Agent可理解为一个能够自动拆解复杂任务,并自己调用各种工具,逐步完成任务的AI助理。
传统的AI工具是被动的,你问什么它答什么。而AI Agent是主动的、目标驱动的,你可以告诉它“帮我规划一个香港三日游,预算5000元”,它会调用天气工具查询天气,调用其他工具查询机票、酒店,对比价格,生成行程,甚至直接帮你预定。
AI Agent具有以下特性:
(1)自主性:给出目标后,无需人工全程步步指导,自己决定下一步该做什么;
(2)主动性:不仅仅是响应需求,给出建议,更能主动发起达成目标所需的一系列行动;
(3)灵活性:能感知所处环境,并实时做出调整。如Agent接收到“30分钟后大家都编辑完了,就关闭共享文档”的指令,当大家在线编辑到第31分钟时,Agent能感知到共享文档还在被使用,则继续等待,直至无人编辑时再关闭文档;
(4)持续性:当用户提的要求需要拆解成多个任务时,Agent能保持记忆和状态,知道自己做到哪一步了,哪些任务已经完成,接下来是什么任务,直到达成目标。
AI Agent是如何工作的
1、规划:将你给出的目标(如“写一份xx行业报告”),分解为可执行的具体步骤(搜索资料、分析数据、撰写初稿、润色排版)。
2、记忆:分为短期记忆(如当前任务进度)和长期记忆(如根据你告诉Agent的信息,记住你的习惯,以及Agent在长期任务过程中总结经验)。
3、工具使用:Agent可以调用各种外部工具来执行任务,如调用搜索引擎收集信息、调用AI写作工具撰写内容、调用AI图像模型生成图片......
4、检查:执行任务后,Agent能够根据结果进行检查,确认是否满足用户的要求,如果结果不理想,它能够分析原因(如最终输出结果格式错误)并在调整后重新尝试。
AI平台上的「Agent模式」
AI Agent应用越来越广(如OpenClaw、QClaw等),各大AI平台也不断推出和完善「Agent模式」,下文以主流平台即梦、Kimi为例展开介绍:
(1)即梦
即梦是一个AI图片/视频/数字人创作平台,Agent模式的推出,大幅提升了AI创作的“语言友好性”,因为在使用图片、视频生成模型时,往往需要特别设计“提示词”,而Agent可以通过通俗的语言生成内容(如“制作睡衣电商素材”),降低提示词设计门槛。
提示词:发给AI的文字指令。如果只是向AI描述“我要生成一只猫”,生成结果可能是任何品种、任何姿势的猫,而优秀的提示词应该是精准的、具体的,如“一只毛发蓬松的挪威森林猫,侧身蹲在布满青苔的古老石墙上,金色的黄昏光线从侧面照射......”
同时,Agent会根据你的需求,自动选择更合适的模型进行生成,确定画面比例,自动丰富图片/视频的风格、场景等细节。
如果你有具体的图片/视频细节要求,建议设计精准的提示词,使用图片/视频生成模型直接生成。
(2)Kimi
Kimi对话框提供了Agent模式的快捷入口,点击按钮后可选择网站、文档、PPT、表格、深度研究等类别的Agent开始对话。
例如,选择文档Agent,让他对比新版和旧版法律文件(以“公司法司法解释”为例),将新、旧内容并排显示,为我们标出新旧法律的差异部分,Kimi Agent将自动编写待办清单:
接着,Agent记录了具体的执行步骤和思考过程:
一系列任务执行完成后,Agent开始对生成结果进行检查:
最终,生成详细、直观的新旧内容对照表:
本文为readaihub.com原创内容,未经书面授权,禁止转载。如需分享文章,请复制本文链接进行分享。
通用对话 - 通义千问
文档及数据处理 - 办公小浣熊
图片视频 - 即梦
图片视频 - Liblib
通用对话 - Gemini
百度智能翻译
法智 - 法律助手
Kimi PPT生成







文章评论