微信扫码
添加专属顾问
我要投稿
DeepManus:让AI大模型像人类一样执行任务。 核心内容: 1. DeepManus的背景与目标:拓展AI大模型在实际场景的应用 2. 多智能体协作系统:分层架构,各司其职,协同处理复杂任务 3. 大模型集成、搜索爬取、代码执行与工作流管理:DeepManus的核心功能
DeepManus 是一个基于 LangManus 开发的 AI 自动化框架,支持GPT,DeepSeek,Qwen等作为大模型,并减少了第三方框架的使用,使其在国内更易于使用。该项目建立在开源社区的卓越工作基础之上,目标是为大模型装上“手脚”,即让大模型能够更广泛地应用于实际操作和任务执行中。
项目背景与目标
背景 :随着人工智能技术的发展,大模型在语言处理等领域展现出了强大的能力。然而,如何将这些大模型更好地应用于实际场景,使其能够像人类一样具备操作和执行能力,成为了一个重要的研究方向。DeepManus 正是在这样的背景下诞生的,它希望通过结合多种技术和工具,拓展大模型的应用范围和实用性。
目标 :主要致力于大模型应用研究,为大模型赋予实际的操作能力,使其能够完成更复杂的任务,如数据收集、分析、报告生成、代码编写与执行等,从而在更多领域发挥作用,提高工作效率和质量。
多智能体协作系统 :采用分层的多智能体架构,包括协调者、规划者、监督者、研究者、编码者、浏览器和报告者等多种智能体。它们各司其职,协同工作,能够处理复杂的任务。例如,当需要收集和分析某个主题的信息并生成报告时,协调者负责接收初始请求并分发任务,规划者制定执行策略,研究者通过网络搜索和数据收集获取信息,编码者进行必要的代码编写和数据处理,浏览器执行网页浏览和信息检索操作,最后由报告者生成综合性的报告和总结。
大模型集成 :支持多种大模型,主要通过 litellm 来支持大多数模型,并且兼容 deepseek 的 API 接口,还支持 Qwen 等开源模型。这种多模型支持的架构使得 DeepManus 能够根据不同任务的需求,灵活地调用不同的模型,充分发挥各模型的优势,提高任务的处理效果和准确性。
搜索与爬取功能 :借助 Tavily API 等工具实现网络搜索,并结合标准脚本和高级内容提取技术,能够从互联网上获取丰富的信息资源。这为 DeepManus 在处理各种需要数据支持的任务时提供了强大的信息收集能力,比如市场调研、新闻分析、学术研究等场景。
代码执行与 Python 集成 :内置 Python REPL 和代码执行环境,并通过 uv 进行包管理,使得 DeepManus 可以直接执行 Python 代码。这意味着用户可以在框架内进行数据分析、科学计算、机器学习模型训练等各种 Python 支持的操作,大大增强了其在数据处理和计算密集型任务中的能力。
工作流管理与可视化 :提供工作流图的可视化功能,能够对多智能体的协调和任务分发进行监控和管理。用户可以通过可视化界面清晰地了解任务的执行流程和各智能体的工作状态,便于对工作流进行优化和调整,确保任务的高效执行。
架构
DeepManus 实现了一个分层的多智能体系统,其中有一个主管智能体协调专门的智能体来完成复杂任务:
系统由以下智能体协同工作:
协调员(Coordinator):工作流程的入口点,处理初始交互并路由任务
规划员(Planner):分析任务并制定执行策略
主管(Supervisor):监督和管理其他智能体的执行
研究员(Researcher):收集和分析信息
程序员(Coder):负责代码生成和修改
浏览器(Browser):执行网页浏览和信息检索
汇报员(Reporter):生成工作流结果的报告和总结
DeepManus 的系统架构主要由以下几个部分组成 :
入口文件 :main.py 是项目的入口文件,启动后会加载配置并初始化各个组件,然后通过服务器接收请求消息并转发给 MultiAgent 进行处理。
多智能体系统 :位于 agents 文件夹下,定义了多个智能体类,如协调者、规划者、监督者等。每个智能体都有其特定的功能和职责,通过协作完成复杂任务。
配置管理系统 :config 文件夹包含了项目的各种配置文件,如 env.py、tools.py、agents.py 等,分别用于配置大模型、API 密钥、基础网址、工具特定设置以及智能体团队组成和系统提示等。
提示词系统 :prompts 文件夹是 DeepManus 的提示词系统的核心所在。每个智能体的角色和行为都通过独立的 Markdown 文件进行定义,使用模板引擎加载 markdown 模板,处理变量替换,并格式化系统提示,从而控制智能体的操作逻辑。
工具集 :tools 文件夹包含了项目中使用的各种工具,如网络工具、代码工具、文件工具、浏览器工具等。这些工具为智能体提供了具体的操作能力,使其能够与外部环境进行交互和执行任务。
服务器组件 :server.py 文件实现了项目的服务器功能,基于 FastAPI 构建,提供聊天接口等服务,支持与其他系统或客户端进行通信,使 DeepManus 能够作为一个服务端应用被调用和集成。
克隆仓库 :使用 Git 命令将 DeepManus 的代码仓库克隆到本地。
安装依赖 :运行 uv sync 命令安装项目所需的依赖包。
安装 Playwright :执行 uv run playwright install 命令,安装 Playwright 以便使用 Chromium 进行浏览器操作。
配置环境 :复制 .env.example 文件并重命名为 .env,然后在 .env 文件中填写相关的 API 密钥等配置信息。
运行项目 :通过执行 uv run main.py 命令启动 DeepManus 项目。
基本执行 :可以使用默认设置直接运行 DeepManus,通过命令行或其他客户端向其发送请求,让智能体执行相应的任务。
API Server :DeepManus 提供了基于 FastAPI 的 API Server,支持流式响应。可以通过发送 POST 请求到指定的 API 端点,如 /api/chat/stream,与 LangGraph 进行调用并获取智能体的流式响应。
高级配置 :用户可以根据需要对项目的各种配置文件进行自定义修改,以满足特定的需求,如调整智能体团队的组成、修改工具的设置、优化智能体的提示词等。
开源协作 :基于开源社区的理念,DeepManus 吸取了许多优秀的开源项目的经验和技术,如 LangChain、LangGraph、Browser-use 等,并且自身也是开源的,鼓励社区贡献和协作,不断推动项目的改进和发展。
易于国内使用 :相比一些其他类似的框架,DeepManus 减少了对第三方框架的依赖,并且在国内能够更方便地获取和使用相关资源,降低了在国内环境下的部署和使用门槛。
强大的功能集成 :将大模型、网络搜索、数据收集、代码执行等多种功能集成于一体,能够满足各种复杂场景下的自动化任务需求,为用户提供个性化的解决方案。
DeepManus-web :这是 DeepManus 的配套前端项目,为用户提供更友好的 Web 界面来与 DeepManus 进行交互。通过这个前端界面,用户可以更方便地发送请求、查看结果、管理任务等,提高了项目的易用性和用户体验。
数据分析与报告生成 :能够自动收集相关数据,进行分析和处理,并生成详细的报告,适用于市场调研、行业分析、学术研究等领域。
自动化测试 :可以模拟用户操作,对软件或网站进行自动化测试,提高测试效率和覆盖率。
内容创作 :通过调用大模型的能力,辅助进行文章撰写、文案生成、创意构思等内容创作工作。
科学研究 :帮助科研人员收集文献资料、分析实验数据、进行科学计算等,加速科研进程。
教育辅导 :为学生提供个性化的学习辅导,如解答问题、批改作业、生成学习资料等。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-30
免费GPU算力部署DeepSeek-R1 32B
2025-05-30
AgenticSeek: 100% 本地替代 Manus AI 的方案
2025-05-29
当Dify遇上可视化图表MCP(AntV),数据展示像呼吸一样简单
2025-05-29
DeepSeek R1新版震撼开源:性能直逼OpenAI o3,编程能力惊艳AI界
2025-05-29
对标 Manus 的开源通用 AI Agent:Suna by Kortix
2025-05-29
刚刚,DeepSeek开源新版R1,媲美OpenAI最高o3模型
2025-05-28
如何管理和调度Dify工作流?
2025-05-28
字节开源文档解析Dolphin,PDF解析效率提升83%,到底行不行?
2024-07-25
2025-01-01
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-07-11
2024-06-12
2024-12-26
2024-08-13
2025-05-28
2025-05-28
2025-05-26
2025-05-25
2025-05-23
2025-05-17
2025-05-17
2025-05-17