AI代理:它们是什么以及为什么2025-2026年是它们开始重要的时候

AI代理是自大型语言模型突破以来AI中最重要的发展。以下是它们实际上是什么、使它们与聊天机器人不同的原因,以及为什么该领域在2025到2026年显著成熟。

什么使某物成为AI代理

聊天机器人接受输入,生成响应,然后停止。AI代理接受目标,决定采取什么行动来实现它,执行那些行动,观察结果,并继续行动直到目标达成或它确定无法继续。关键区别:自主性(代理决定步骤顺序,而不仅仅是响应)、工具使用(代理可以调用外部工具——搜索网络、执行代码、调用API、读/写文件),以及持久性(代理在多个步骤中维持状态)。代理的技术组成部分:LLM作为”大脑”(推理下一步做什么)、工具集(代理实际上能做什么)、记忆机制(它如何跟踪它做过什么和观察到什么),以及编排循环(保持其运行直到任务完成的机制)。

2025到2026年改变了什么

三件事使代理在2025到2026年变得实际有用而不仅仅是理论上有趣。第一:模型在指令跟随方面变得更好。早期代理会经常失去对目标的跟踪,陷入循环,或做出累积的推理错误。Claude 3.5+和GPT-4o显示出在许多步骤中维持目标状态的显著更好的能力。第二:工具生态系统成熟。LangChain的LangGraph、Anthropic的代理工具、OpenAI的助手API和模型上下文协议(MCP)给了开发者标准方式来给模型提供工具并构建代理循环,而无需重新发明基础设施。第三:计算机使用能力出现——可以控制浏览器或桌面、截屏、点击和打字的代理极大地扩展了动作空间。Anthropic的计算机使用能力(2024年底发布)和其他提供商的类似能力意味着代理可以在为人类设计的环境中操作,而不仅仅是API。

真实的代理应用

软件工程代理:Claude Code、GitHub Copilot Workspace和类似工具可以接受任务描述、读取相关代码、编写更改、运行测试并迭代——作为自主执行明确指定任务的初级开发者发挥作用。研究代理:给定一个研究问题,代理可以搜索网络、阅读论文、综合发现并生成报告——以前需要数小时人工关注的任务。客户服务代理:可以查找订单状态、处理退款、更新账户信息,并仅在需要时升级到人工的代理——用可以处理任意请求的代理取代脚本化聊天机器人。数据分析代理:给定数据库和问题,代理可以编写和执行SQL查询、解释结果并生成可视化。所有这些的模式:代理处理结构化执行;人类提供目标并审查输出。

代理仍然失败的地方

长周期任务(需要数百个顺序步骤而没有人类反馈的任务)仍然不可靠——错误率在长序列中复合。代理不擅长知道自己不知道什么,往往会产生看起来合理但错误的行动幻觉。信任和验证:可以采取现实世界行动的自主代理(发送电子邮件、在生产中执行代码、处理付款)需要仔细的护栏——错误的代价比聊天机器人交互高。当前的实际模式:人在回路的代理,人类在执行前审查和批准代理的计划行动,以比完全自主操作低得多的风险提供大部分效率收益。

上一篇 AI Agents: What They Are and Why 2025-2026 Is When They Started Mattering
下一篇 Living Abroad with Children: What Parents Don't Expect