微信扫码
添加专属顾问
我要投稿
资深软件工程师罗小东分享通用智能体设计初稿,探索AI技术与业务场景融合新路径。 核心内容: 1. 通用智能体设计理念与原则,聚焦中小团队业务需求 2. 结果型交付与低成本部署,适应多业务场景 3. 多Agent协作与结果可控性,提升输出效果与业务聚焦
软件工程师罗小东,拥有多年架构和平台设计经验,目前专注于平台与新技术的融合研究。
前言
通用智能体是开源AIP项目上进行的探索,这里是近段时间输出1.0初版本设计,另外所谓通用的意思不会约束在某一个场景上面。
概述
单智能体的限制还有chatbot的限制,这里主要参考扣子空间,OpenManus等设计。
原则依然是针对于业务深入,针对的是中小团队场景,私有数据和大模型结合,设计思路如下:
结果型交付,需要结合业务有真实可用的输出
结合内部真实场景,不要娱乐型AI,结果可用
中小团队都能内部部署,低成本运作
可以切换不同场景,多Agent通用场景和业务型场景
过程还可以修改,可控还有进一步调整
…
执行过程通过规划-推理-执行-总结-结果这个流程,推理主要是使用ReAct设计,每个设计是思路不一,我有我思,也期望有兴趣的同学可以交流。
输出效果
我们可以来看看输出的规划文档输出效果,这里以一份短视频营销输出文档为示例(非内部数据):
这里是数据分析输出的效果,结合内部数据直接导入分析的(内部数据库):
还有网页版本的数据分析结果,这里会有比较直观的图形分析:
网页版本的分析展示在一定程度上效果较好,但是内容结构相对于Word版本来说,展示还需要进一步的提升。
产品设计
以下为产品设计思路。
交付型结果
出来的结果需要达到可用或是结合业务的,这里直接链接的内部数据资产平台,直接提供查询和全文检索:
以下为输出的电商数据分析例子:
整体效果内容较为丰满,如果有不同的要求,输出的内容方向,也会有不同的结果,这里是AI默认生成。
低成本部署和落地
考虑到低成本,中小团队可以内部私有化,去掉了虚拟机或是其它不一定需要的工具,在一些场景上可能无法实现,比如浏览器RPA操作。
考虑到稳定性,这里数据检索,我们通过数据资产套件来处理,另外结合搜索引擎网络数据检索来实现。
下面是数据抽取的简单流程:
实时部分我们通过Chatbot来做显示进度还有运行情况,如下图:
这样也可以显示效果,我们发现也是可以满足场景需求。
多Agent多业务场景
我们之前研究看到的,类似Manus,它的Agent协作是固定的,这些在输出结果精度,幻觉,检索等方面需要较高技术难度,内容可能不够聚焦。
在这里我们设计场景Agent可以自定义选择,每个场景,有专门的Agent有自己行业的知识库等,使得Agent还有结果聚焦在这个业务场景上面。
通过多种Agent的选择和自定义,我们可以灵活的选择和搭配不同的智能体能力。
结果可控可修改
我们需要规划的结果可以修改,每个规划阶段过程也可以修改,以下为整体的设计界面:
左边的规划结果是可以调整修改还有重新生成结果的,内容也可以编辑,达到更优的结果。
以下为输出的指定Agent来做报表输出,也可以不同场景切换不同的Agent来做输出:
报表输出的结果显示也是由AI生成,每个显示结果和报表都做了二次设计和定义不同的指令。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-30
n8n:免费+开源的自动化神器,比dify更简单,比Make更强大!
2025-04-30
宝藏发现:Sim Studio,一款让AI工作流搭建变简单的开源利器
2025-04-29
我们有必要使用 Qwen3 吗?
2025-04-29
Qwen3开源发布:Think Deeper, Act Faster!社区推理、部署、微调、MCP调用实战教程来啦!
2025-04-29
阿里 Qwen3 技术详解: 4B 参数媲美 72B,MoE 架构的开源突破
2025-04-29
PAI-Model Gallery 支持云上一键部署 Qwen3 全尺寸模型
2025-04-29
Qwen3中性能最强MOE模型部署抛砖引玉 + 实测
2025-04-29
体验了最新的Qwen3之后,端侧之王果然没有让我失望!
2024-07-25
2025-01-01
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-07-11
2024-06-12
2024-08-13
2024-12-26
2025-04-29
2025-04-28
2025-04-28
2025-04-28
2025-04-21
2025-04-19
2025-04-17
2025-04-15