支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Serverless JManus: 企业生产级通用智能体运行时

发布日期:2025-07-04 19:22:44 浏览次数: 1527
作者:阿里云云原生

微信搜一搜,关注“阿里云云原生”

推荐语

企业级智能体开发新选择:JManus框架让Java开发者轻松构建高性能多智能体应用,结合Serverless实现弹性高可用部署。

核心内容:
1. JManus框架的核心特性与OpenManus多智能体实现
2. 基于Spring AI Alibaba的性能优势与Dify平台对比
3. Serverless架构(SAE+FC)在智能体运行时的最佳实践

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


概述:本文介绍如何使用 JManus 框架构建通用智能体应用,部署并运行在 Serverless 运行时,构建企业级高可用智能体应用的实践经验。基于阿里云 Serverless 应用引擎SAE 运行稳定高可用的智能体应用, 基于函数计算 FC 运行安全隔离的工具执行任务,实现最佳的 Serverless 智能体应用运行时。


JMnaus: 面向 Java 的

企业级通用智能体框架

Cloud Native


通用多智能体的企业级开发框架


JManus 是一个以 Java 为核心、完全开源的 OpenManus 实现,隶属于 Spring AI Alibaba 项目。


它旨在让 Java 程序员更便捷地使用 AI 技术,支持多 Agent 框架、网页配置 Agent、MCP 协议和 PLAN-ACT 模式。项目在 GitHub 上已获近 3k star,可集成多个大模型如 Claude 3.5 和 Qwen3。


JManus 的核心特点包括:


  • 完美实现了 OpenManus 多 Agent 框架
    借助 Spring AI 和 Java 的深度结合,开发者可以轻松构建和管理多个智能体,让复杂任务的分工与协作变得高效且可控。
  • JManus 无缝支持 MCP(Model Context Protocol)协议
    Agent 不仅可以调用本地或云端的大语言模型,还能与各类外部服务、API、数据库等进行深度交互,极大拓展了应用场景和能力边界。
  • JManus 原生支持 PLAN-ACT 模式
    能够让 Agent 具备复杂推理、分步执行和动态调整的能力,适用于多轮对话、复杂决策、自动化流程等高阶 AI 应用场景。


而随着多智能体业务场景逐渐成熟,企业亟需 JManus 这样的框架来构建通用的业务逻辑。Spring AI Alibaba 也在探索多智能体支持,满足更多用户的需要。



优秀的运行时性能


基于 Spring AI Alibaba 构建的智能体应用,相比于 dify 等低代码平台构建的智能体具有明显的性能和可用性优势。


从 Dify 可视化界面一键导出 Spring AI Alibaba 工程。下图展示了基于从 Dify 导出为 SAA 工程,运行模式性能前后的变化:可以看到,基于 Spring AI Alibaba 的智能体在运行性能上大幅领先 Dify 原生的智能体应用。


Dify 智能体压测:



基于 Dify 导出的 Spring AI Alibaba 智能体应用压测:



可见,Dify 适合在测试环境快速验证想法,而生产环境推荐使用性能更好的 SAA Java 运行时。


SAE & FC: 

弹性高可用 Serverless 运行时

Cloud Native


弹性高可用的智能体运行环境


在智能体应用的构建与运行中,传统的低代码平台架构存在明显瓶颈:所有智能体共享单一 Pod 资源,高流量场景下易导致性能干扰与资源争用。而基于 JManus 与阿里云 SAE 的智能体应用,通过全栈 Serverless 能力,在高可用性、弹性扩展、性能优化与成本控制等方面展现出显著优势,为智能体应用的规模化落地提供坚实支撑。


基于 Serverless JManus 构建的智能体应用在高可用、弹性、性能方面具有以下明显优势:


1. 高可用性


  • 隔离的网络和资源环境每个智能体应用运行在隔离的 VPC 网络和资源隔离的安全容器中,不同智能体应用享有独占的弹性资源,不会造成性能挤占问题。
  • 多可用区部署
    智能体应用默认部署于多可用区,避免单点故障,保障数据链路的持续可用。
  • 金丝雀发布与灰度流量验证
    • 分批灰度发布通过 SAE 内置的灰度发布策略,逐步将流量切至新版本,降低发布风险。
    • 全链路灰度集成 MSE 微服务治理,支持从网关到应用的全链路灰度流量控制,确保验证过程无损。
  • 无损上下线
    利用微服务治理能力,实现应用的平滑启停,避免因版本切换导致的服务中断。


2. 秒级弹性伸缩


  • 多维度弹性策略
    根据 CPU、内存、QPS、RT 等指标自动触发扩缩容,确保高并发场景下的服务稳定性。
  • 毫秒级资源拉起
    SAE 支持秒级 Pod 启动,快速响应突发流量,避免传统架构因冷启动导致的响应延迟。并针对 Pod 启动阶段进行了深入优化,减少调度和网卡挂载的延迟。


3. 极致性能


  • 加速镜像
    利用阿里云 DADI 技术,加速镜像拉取与启动,缩短应用初始化时间。
  • Java Runtime 启动加速
    特别针对 Java 应用,SAE 提供 JVM 快照、 类预加载、JIT 优化 等特性,显著降低 JVM 启动耗时。
  • 长连接支持
    集成 CLB/NLB 网关,支持 keep-alive 模式,保障 SSE(Server-Sent Events)等长连接场景的稳定性,避免请求断开。


工具执行安全隔离的沙箱


在智能体的工具调用或任务执行过程中,安全性和资源效率是两大核心挑战。为应对这一需求,函数计算通过其独特的毫秒级冷启动能力弹性资源调度机制,为工具执行提供了理想的安全沙箱环境,同时结合 MCP 工具市场的生态支持,进一步提升了系统的可靠性和开发效率。


1. 安全沙箱的实现:隔离与防护


  • 容器化隔离
    每个工具调用任务在 FC 中被封装为独立的容器实例,运行于轻量级虚拟机(VM)中,确保任务之间资源隔离,避免因代码缺陷或恶意行为导致的系统崩溃或数据泄露。
  • 权限控制
    FC 支持细粒度的权限管理(如 IAM 角色绑定),限制容器对主机系统、网络及存储的访问权限,防止越权操作。
  • 运行时安全加固
    通过默认禁用高危操作(如文件系统写入、进程创建)和强制使用只读文件系统,进一步降低安全风险。


2. 极致弹性与按需付费


  • 毫秒级冷启动
    函数计算 FC ,能在毫秒级启动容器实例,快速响应瞬时高并发请求,避免传统服务器因预热延迟导致的性能瓶颈。
  • 弹性伸缩
    根据实时流量自动扩缩容,确保在空闲时段仅保留最小资源占用,而在流量高峰时动态分配更多计算资源,实现成本与性能的平衡
  • 按需计费
    仅对实际执行时间(按毫秒计)和资源消耗收费,避免闲置资源浪费,尤其适合智能体工具调用的间歇性高并发特性。


函数计算支持 MCP 市场,也可以一键部署多种 MCP 工具:



实战示例




Cloud Native


示例架构图


部署 JManus 应用到 SAE


1. 申请百炼的 OPENAI_API_KEY 

2. 来到 SAE 控制台应用中心,选择 JManus 模版部署 JManus 应用:https://saenext.console.aliyun.com/cn-hangzhou/scene-market


在部署界面,选择对应的 VPC 网络配置,填入 OPENAI_API_KEY,弹性公网可以选择“新建弹性公网”。


 

配置好后点击立即创建,即开始部署流程。



3. 部署完成后,在计算巢服务实例“立即使用”这里可以找到能直接访问的地址。


也可以在 SAE 控制台微服务应用中看到 JManus 应用的公网访问地址。




开发 MCP 服务并部署到函数计算


1. 进入 Function AI 控制台 MCP 市场。

https://functionai.console.aliyun.com/plugins?tab=plugins_platform&subtab=mcp


2. 选择实时天气 MCP 服务,一键部署,部署完成后就可以得到可以远端访问的 SSE 地址。




JManus 自定义智能体和 MCP 配置


基于社区版的 JManus 也提可以直接配置 MCP 服务和创建智能体的能力,回到对话界面的“设置”,然后配置 MCP 服务。


image.png



在 JManus 的 MCP 配置上添加函数极端的 MCP 服务地址:


{  "mcpServers": {    "openwether": {      "type": "sse",      "url": "https://defauxxx-xxxxxx.cn-shanghai-vpc.fcapp.run/sse",       "timeout": 45000    }  }}


创建智能体并为智能体配置工具:




配置好后,可以回到对话框,询问天气,可以看到智能体的工具调用的执行,返回了实时的天气信息。



总结




Cloud Native


本文展示了基于 Serverless 平台 SAE Serverless 应用引擎和 FC 函数计算,作为 JManus 框架的运行时,能达到强强联合的效果,满足通用智能体开发的业务场景需求,又满足企业生产级高可用的运行时环境。


并且基于 Serverless 安全容器,能满足 browser use 等工具和代码执行的安全隔离环境需求,是用户基于云原生构建智能体应用的不二选择。


未来 SAE 将和 Spring AI Alibaba 做更深入的集成,提供最佳 Java 智能体应用运行时。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询