支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


企业内部规模化AI Agents应用与实践用例

发布日期:2025-05-08 06:10:55 浏览次数: 1523 作者:思维小岛
推荐语

深入探讨企业如何利用AI智能体提升运营效率和创造价值。

核心内容:
1. AI智能体与传统自动化的区别及其应用场景
2. 构建智能体所需的核心组件和最佳实践
3. 实践中智能体的编排模式和案例分析

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

深入解析基于大型语言模型(LLM)的智能体(Agents)在企业中的应用、构建方法、采纳策略以及如何识别和推广其用例;全面通过实践介绍AI,尤其是智能体,如何变革企业运营,提高效率,并创造新的价值。

什么是智能体(Agent)以及何时构建?

智能体是能够独立代表用户执行任务的系统。与传统的自动化软件不同,智能体具有高度的独立性。它们利用LLM来管理工作流程的执行和做出决策,能识别何时完成工作流程,并在需要时主动纠正其行动。智能体还可以访问各种工具与外部系统交互(用于获取上下文和执行操作),并根据工作流程的当前状态动态选择适当的工具,同时始终在明确定义的护栏内运行。不使用LLM来控制工作流程执行的应用(如简单聊天机器人)不被视为智能体。

构建智能体适用于传统确定性和基于规则的方法无法奏效的工作流程。优先考虑那些以前难以实现自动化、特别是传统方法遇到阻碍的工作流程。这包括:

  • 复杂的决策制定:涉及细致判断、例外情况或上下文敏感决策的工作流程,例如客户服务中的退款批准。
  • 难以维护的规则:由于规则集庞大复杂而变得难以管理,更新成本高或容易出错的系统,例如供应商安全审查。
  • 严重依赖非结构化数据:涉及解释自然语言、从文档中提取意义或与用户进行对话的场景,例如处理房屋保险索赔。

在构建智能体之前,验证您的用例是否明确满足这些标准至关重要,否则确定性解决方案可能就足够了。

智能体的设计基础

智能体在最基本的形式下包含三个核心组件:

  1. 模型(Model):驱动智能体推理和决策的LLM。不同的模型在任务复杂性、延迟和成本方面有不同的权衡。一种有效的方法是先用最强大的模型构建原型以建立性能基准,然后尝试替换更小的模型以优化成本和延迟,前提是仍能达到可接受的结果。
  2. 工具(Tools):智能体可用于执行操作的外部函数或API。工具扩展了智能体的能力。
    主要有三种类型的工具:
  • 数据工具:使智能体能够检索执行工作流程所需的上下文和信息,例如查询数据库、阅读文档或搜索网页。
  • 行动工具:使智能体能够与系统交互以执行操作,例如发送电子邮件、更新记录或转移客户服务工单。
  • 编排工具:智能体本身也可以作为其他智能体的工具。 工具应具有标准化定义,以实现工具和智能体之间灵活的多对多关系。当所需工具数量增加时,可以考虑将任务分配给多个智能体。
  • 指令(Instructions):明确指导和护栏定义智能体的行为方式。高质量的指令对于减少歧义和改进智能体决策至关重要。最佳实践包括使用现有文档创建例程、提示智能体分解任务、定义清晰的操作以及捕获边缘情况。

  • 智能体的编排模式

    虽然构建完全自主的复杂智能体很诱人,但增量式方法通常更成功。编排模式主要分为两类:

    • 单智能体系统(Single-agent systems):一个配备适当工具和指令的模型在循环中执行工作流程。通过逐步添加工具,一个单智能体可以处理许多任务,同时保持复杂性易于管理。单智能体通过一个“运行”循环操作直到达到退出条件,例如调用工具、生成特定输出、发生错误或达到最大轮次。使用提示模板是管理复杂性而不切换到多智能体框架的有效策略。通常建议先最大化单个智能体的能力,因为更多智能体可能引入额外的复杂性和开销。
    • 多智能体系统(Multi-agent systems):工作流程执行分布在多个协调的智能体之间。当单智能体难以遵循复杂指令或工具选择不一致时,可能需要拆分系统并引入更多不同的智能体。拆分智能体的实用指南包括处理复杂逻辑或工具过载。多智能体系统可以建模为图。两种主要的多智能体模式是:
      • 经理模式(Manager pattern):一个中央“经理”智能体通过工具调用协调多个专业智能体,每个智能体处理特定任务或领域。经理智能体控制工作流程执行并与用户交互。
      • 去中心化模式(Decentralized pattern):多个智能体作为对等方操作,根据其专业化相互交接任务。交接是一种单向转移,允许一个智能体将控制权委托给另一个智能体,并转移最新的会话状态。这种模式适用于不需要单个智能体保持中央控制或合成的场景,每个智能体可以接管执行并与用户交互。

    护栏(Guardrails)

    护栏是确保智能体安全、可预测和有效运行的关键组件。精心设计的护栏有助于管理数据隐私和声誉风险。它们应与强大的身份验证、授权协议、严格的访问控制和标准软件安全措施结合使用。护栏是一个分层防御机制,结合使用多个专业护栏可以创建更具弹性的智能体。

    护栏的类型包括:

    • 相关性分类器(Relevance classifier):确保智能体响应保持在预期范围内。
    • 安全分类器(Safety classifier):检测试图利用系统漏洞的不安全输入(如越狱或提示注入)。
    • PII过滤器(PII filter):通过审查模型输出防止个人身份信息(PII)的非必要暴露。
    • 审核(Moderation):标记有害或不当输入(如仇恨言论)以维持安全互动。
    • 工具保护(Tool safeguards):根据风险(如读写访问、可逆性、财务影响)评估工具,并触发自动化操作或升级到人工干预。
    • 基于规则的保护(Rules-based protections):简单的确定性措施(如黑名单、输入长度限制)来阻止已知威胁。
    • 输出验证(Output validation):通过提示工程和内容检查确保响应符合品牌价值观。

    构建护栏应首先关注数据隐私和内容安全,然后根据实际遇到的边缘案例和故障添加新的护栏,并优化安全性与用户体验。

    计划人工干预

    人工干预是智能体部署中的关键保护措施。它允许智能体在无法完成任务时优雅地转移控制权。典型的触发器包括超出故障阈值(如多次尝试后仍无法理解用户意图)或高风险操作(如取消订单、批准大额退款)。

    企业AI采纳的经验教训

    从领先企业采纳AI的经验中,可以总结出七个关键教训:

    1. 从评估开始(Start with evals):使用系统化评估流程来衡量模型在您的用例中的表现。例如,摩根士丹利通过严格评估(如语言翻译、总结、人工训练师比较)获得了将AI用例投入生产的信心。评估过程应针对关键指标(如准确性、合规性、安全性)来验证和测试模型的输出质量。
    2. 将AI嵌入产品中(Embed AI in your products):通过AI创造新的客户体验和更相关的互动。例如,Indeed使用AI(GPT-4o mini)为其职位推荐提供个性化的“为什么”解释,带来了20%的应用开始率提升13%的下游成功率提升
    3. 现在开始并尽早投资(Start now and invest early):越早开始,价值复合效应越明显。Klarna的AI助理在几个月内处理了三分之二的客户服务聊天,将平均解决时间从11分钟减少到2分钟,预计节省4000万美元。这种成果是持续测试和改进的结果。
    4. 定制和微调模型(Customize and fine-tune your models):根据您的用例细节调整AI可以显著增加价值。微调是将模型定制到您组织的特定数据和需求,如量身定制的西装。它提高了准确性、领域专业知识、一致性风格并加快了产出。例如,Lowe's通过微调模型将产品标签准确率提高了20%,错误检测能力提高了60%
    5. 将AI交到专家手中(Get AI in the hands of experts):最了解流程的人最适合用AI改进它。BBVA的员工被鼓励自行发现用例,在五个月内创建了超过2,900个自定义GPTs,其中一些将项目时间从几周缩短到几小时。
    6. 解放开发者(Unblock your developers):自动化软件开发生命周期可以倍增AI的效益。Mercado Libre的Verdi平台利用GPT加速AI应用构建,帮助提高库存能力(产品目录数量增加100倍)、改进欺诈检测(针对被标记项目的准确率接近99%)和个性化通知。
    7. 设定大胆的自动化目标(Set bold automation goals):许多流程包含大量重复性工作,非常适合自动化。OpenAI自身通过内部自动化平台自动化了数十万个支持任务,将团队解放出来处理更高价值的工作。

    企业应围绕高回报、低努力的用例展开,通过迭代学习,并将经验推广到新领域。

    识别和推广AI用例

    • 领导者主导和鼓励
    • 赋能员工自行寻找最适合他们的用例,这通常是更快取得成功的方式。

    • 通过黑客马拉松、工作坊和同侪学习等方式鼓励采纳。

    寻找AI用例的机会可以关注以下三个关键领域:

    • 重复的低价值任务:解放员工从事更具策略性的工作。
    • 技能瓶颈:帮助员工扩展技能,减少对其他部门或专家的依赖。
    • 应对模糊性:在路径不明确时,AI可以作为催化剂,帮助生成想法、分析数据和提出下一步行动。

    为了帮助团队识别用例,可以将AI的使用分为六个核心用例类型:

    1. 内容创作(Content creation):AI可以协助生成草稿、编辑、校对、翻译和调整内容风格,例如营销活动文案、政策文档、产品描述等。
    2. 研究(Research):AI可用于快速学习概念、搜索网页获取信息或进行更全面的多步研究。例如,调查行业、分析竞争对手、搜索文档或法规。深度研究是AI代理能力的一个示例,可以独立进行多步网络研究并综合报告。
    3. 编程(Coding):工程师可以使用AI进行调试、生成草稿、代码移植和代码讨论。非编程人员也可以使用自然语言生成脚本、SQL查询或可视化。
    4. 数据分析(Data analysis):AI可以帮助整合不同来源的数据、识别见解和趋势,处理电子表格数据,无需高级技能。例如,分析销售数据、客户反馈或财务报表。
    5. 构思与策略(Ideation/strategy):AI可以帮助头脑风暴、结构化文档、诊断策略或提供基于目标的反馈。例如,生成营销活动想法、制定市场扩张计划或构建产品发布计划。
    6. 自动化(Automations):将重复性任务交给AI完成。例如,生成定期报告、会议纪要总结或客户洞察摘要。Operator是另一个代理能力的示例,可以通过虚拟浏览器与网络应用交互,自动化软件测试或系统更新等工作流程。

    使用一个价值评估框架来优先考虑用例。这个框架将用例按照对公司的价值(影响)和构建所需的投入程度进行分类。重点关注高回报、低投入的“快速见效”项目,这些是构建动力的最佳起点。

    最终,应鼓励团队将AI应用到多步工作流程中,而不仅仅是单个任务。将工作流程分解为单个任务,并识别核心用例,有助于为未来AI智能体能够独立完成整个项目做准备。

    总而言之,基于LLM的智能体代表了工作流程自动化的新时代,它们能够推理模糊性,利用工具执行多步任务,具有高度的自主性。它们特别适用于传统方法不足的复杂、非结构化或规则脆弱的场景。构建可靠智能体需要坚实的基础(模型、工具、指令)和适当的编排模式(从单智能体开始,按需发展到多智能体),以及在各个阶段(输入过滤、工具使用、人工干预)的关键护栏。企业成功采纳AI的关键在于采用迭代、实验的方法,从评估开始,将AI深度嵌入产品和流程,赋能员工和开发者,并设定大胆的自动化目标。识别和推广用例涉及理解AI的核心能力,关注重复性工作、技能瓶颈和模糊性等领域,并利用影响/努力框架优先处理最具价值的项目。通过结合这些策略,企业可以有效地识别、构建和扩展AI应用,实现显著的业务价值。

    (以上内容由我和AI协作生成)


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询