我要投稿

低显存福音！OpenAvatarChat开源！实测仅需4G显存即可畅玩多模态数字人！windows保姆级本地部署教程！

发布日期：2025-06-16 06:25:22 浏览次数： 2437

作者：AI与喵部署日记

微信搜一搜，关注“AI与喵部署日记”

Open Avatar Chat 是由阿里开源的数字人对话系统，让数字人具备视觉感知+语音交互+情感表达多模态能力，能达到类似真人的对话体验。

本教程将采用硬件需求最低的部署方案：SenseVoice + LLM API + CosyVoice API 的方式运行 LAM 或 LiteAvatar 数字人。显存占用最低仅有3G！

实测显存占用情况

在搭载 RTX3060 6G 的笔记本电脑上运行测试
运行LAM数字人，仅占用3.1G显存！对话流畅，性能相当强悍！
实测图如下：

运行LiteAvatar数字人，也仅需5.3G显存！实测图如下：

系统依赖

• N卡4G以上显存
• N卡支持 CUDA >= 12.4
• ffmpeg
• miniconda 或 Anaconda
• 阿里云百炼API KEY(可白嫖)

安装 miniconda 、ffmpeg 可查看往期文章
• 安装miniconda
• 安装ffmpeg

拉取仓库

# 拉取主仓库 --depth=1 仅拉取最新的提交，减少空间占用
git clone --depth=1 https://github.com/HumanAIGC-Engineering/OpenAvatarChat.git
cd OpenAvatarChat

# 拉取子仓库
git submodule update --init --recursive

逐个拉取仓库(推荐)

针对网络环境不好的同学，推荐逐个拉取仓库。在拉取失败时能快速定位到异常仓库。
所有git clone命令均带有路径，可直接在主仓库根目录下执行。

注：由于是最小化组件安装，没有拉取MiniCPM-o仓库

所有子仓库可在.gitmodules文件中查看

主仓库 OpenAvatarChat

git clone --depth=1 https://github.com/HumanAIGC-Engineering/OpenAvatarChat.git
cd OpenAvatarChat

liteavatar

# 跳过lfs下载大型文件，后续把大型文件单独下载后放入指定位置
# set GIT_LFS_SKIP_SMUDGE=1
git clone --depth=1 https://github.com/HumanAIGC/lite-avatar.git ./src/handlers/avatar/liteavatar/algo/liteavatar

liteavatar仓库中共有三个大型文件，把它们单独下载到本地再放到对应位置：

• weights\model_1.onnx (175 MB)
• weights\speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch\model.pb (839 MB)
• weights\speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch\lm\lm.pb (226 MB)

silero_vad

git clone --depth=1 https://github.com/snakers4/silero-vad.git ./src/handlers/vad/silerovad/silero_vad

gradio_webrtc_videochat

git clone --depth=1 https://github.com/HumanAIGC-Engineering/gradio-webrtc.git ./src/third_party/gradio_webrtc_videochat

CosyVoice

# CosyVoice 仓库中包含子仓库：Matcha-TTS。添加参数 --recursive 将自动拉取
git clone --depth=1 --recursive https://github.com/FunAudioLLM/CosyVoice.git ./src/handlers/tts/cosyvoice/CosyVoice

LAM_Audio2Expression

git clone --depth=1 https://github.com/aigc3d/LAM_Audio2Expression.git ./src/handlers/avatar/lam/LAM_Audio2Expression

安装依赖

conda新建python 3.10环境

# 新建名为 openavatarchat 的 python 3.10 环境
conda create -n openavatarchat python=3.10
# 激活环境
conda activate openavatarchat

conda安装pynini

conda install -c conda-forge pynini==2.1.6

安装pytorch

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

安装fastrtc

这个fastrtc是经过OpenAvatarChat团队修改的版本，且打包成了whl包，跟随OpenAvatarChat仓库发布。千万不要安装gradio版的fastrtc

pip install -i https://mirrors.aliyun.com/pypi/simple ./src/third_party/gradio_webrtc_videochat/dist/fastrtc-0.0.19.dev0-py3-none-any.whl

安装其它依赖

请严格按照以下顺序安装依赖包。已经过多轮测试，安装后可正常运行。

pip install -i https://mirrors.aliyun.com/pypi/simple aiohttp==3.11.16
pip install -i https://mirrors.aliyun.com/pypi/simple modelscope==1.25.0
pip install -i https://mirrors.aliyun.com/pypi/simple openai==1.74.0
pip install -i https://mirrors.aliyun.com/pypi/simple dynaconf==3.2.10
pip install -i https://mirrors.aliyun.com/pypi/simple email-validator==2.2.0
pip install -i https://mirrors.aliyun.com/pypi/simple fastapi-cli==0.0.7
pip install -i https://mirrors.aliyun.com/pypi/simple loguru==0.7.3
pip install -i https://mirrors.aliyun.com/pypi/simple opencv-python-headless==4.11.0.86
pip install -i https://mirrors.aliyun.com/pypi/simple pyaml==25.1.0
pip install -i https://mirrors.aliyun.com/pypi/simple funasr==1.2.6
pip install -i https://mirrors.aliyun.com/pypi/simple vocos==0.1.0
pip install -i https://mirrors.aliyun.com/pypi/simple vector-quantize-pytorch==1.21.9
pip install -i https://mirrors.aliyun.com/pypi/simple transformers==4.44.1
pip install -i https://mirrors.aliyun.com/pypi/simple h5py==3.12.1
pip install -i https://mirrors.aliyun.com/pypi/simple pypinyin==0.53.0
pip install -i https://mirrors.aliyun.com/pypi/simple typeguard==2.13.3
pip install -i https://mirrors.aliyun.com/pypi/simple onnxruntime-gpu~=1.20.1
pip install -i https://mirrors.aliyun.com/pypi/simple onnxruntime~=1.20.1
pip install -i https://mirrors.aliyun.com/pypi/simple dashscope==1.23.1
pip install -i https://mirrors.aliyun.com/pypi/simple edge-tts==7.0.0
pip install -i https://mirrors.aliyun.com/pypi/simple addict==2.4.0
pip install -i https://mirrors.aliyun.com/pypi/simple yapf==0.40.1
pip install -i https://mirrors.aliyun.com/pypi/simple spleeter==2.4.0
pip install -i https://mirrors.aliyun.com/pypi/simple gradio==5.9.1

下载模型文件

模型文件均来自 modelscope 魔塔社区，无需担心网络问题。
在OpenAvatarChat根目录下执行，模型文件会下载到对应的文件夹中

SenseVoice语音识别模型

modelscope download --model iic/SenseVoiceSmall --local_dir ./models/iic/SenseVoiceSmall

LiteAvatar提供的预训练数字人形象(100个)

modelscope download --model HumanAIGC-Engineering/LiteAvatarGallery --local_dir ./resource/avatar/liteavatar

lam 数字人依赖模型

modelscope download --model AI-ModelScope/wav2vec2-base-960h --local_dir ./models/wav2vec2-base-960h

modelscope download --model Damo_XR_Lab/LAM_audio2exp LAM_audio2exp_streaming.tar --local_dir ./models/LAM_audio2exp

注意：这里的 LAM_audio2exp_streaming.tar 压缩包需要解压，否则在运行lam数字人时报错：No checkpoint found

使用WinRAR解压有可能会遇到只解压出一个文件的问题，正常解压出来的应当是一个文件夹。猜测可能是解压软件的问题。遇到问题的同学可以修改LAM_audio2exp_streaming.tar文件后缀名为.tar.gz即可使用WinRAR解压。
如下图：

解后的目录结构为:
./models/LAM_audio2exp/pretrained_models/LAM_audio2exp_streaming.tar

白嫖大模型API

白嫖 CosyVoice 语音合成

• 阿里云百炼 CosyVoice-v1 链接:

https://bailian.console.aliyun.com/?tab=model#/model-market/detail/cosyvoice-v1

当白嫖额度消耗殆尽时，可在配置文件中替换为EDGE-TTS语言合成，但速度稍慢

白嫖LLM大语言模型

• 阿里云百炼 qwen-vl-plus 链接:

https://bailian.console.aliyun.com/?tab=model#/model-market/detail/qwen-vl-plus

• OpenRouter qwen2.5-vl-72b-instruct 链接:

https://openrouter.ai/qwen/qwen2.5-vl-72b-instruct:free

注意

在登录阿里云百炼后，所使用模型的白嫖额度会显示在页面中，注意查看：

修改配置文件

配置文件位于：config 文件夹内

一、配置LiteAvatar数字人

1. 复制配置文件chat_with_openai_compatible_bailian_cosyvoice.yaml到同目录内，重命名为liteavatar.yaml
2. 编辑liteavatar.yaml文件，把CosyVoice apikey和LLM大语言模型apikey填进去。如下图示例：

若是使用OpenRouter的 LLM大模型，则要修改 model_name、api_url、api_key。如下图示例：

二、配置LAM数字人

1. 复制配置文件chat_with_openai_compatible_bailian_cosyvoice.yaml到同目录内，重命名为lam.yaml
2. 编辑lam.yaml文件，填写CosyVoice apikey和LLM大语言模型apikey，与上文配置LiteAvatar数字人相同
3. 把RtcClient删除，替换为LamClient

LamClient:
        module: client/h5_rendering_client/client_handler_lam
        asset_path: "lam_samples/image.zip"
        concurrent_limit: 5

参考下图：

4.把LiteAvatar删除，替换为LAM_Driver

LAM_Driver:
        module: avatar/lam/avatar_handler_lam_audio2expression

参考下图：

使用EDGE-TTS语言合成

1. 编辑yaml配置文件
2. 把CosyVoice配置项删除，或者把CosyVoice配置项的enabled改为False
3. 把下面的Edge_TTS配置项添加到配置文件中去

Edge_TTS:
        enabled: True
        module: tts/edgetts/tts_handler_edgetts
        voice: "zh-CN-XiaoxiaoNeural"

运行数字人

运行 LiteAvatar版本数字人

python src/demo.py --config config/liteavatar.yaml

运行 LAM 版数字人

python src/demo.py --config config/lam.yaml

在输出如下内容时，即可在浏览器中打开http://127.0.0.1:8282开始体验

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-07-31

Ollama 发布桌面客户端，能让用户轻松管理 Ollama 模型，无需依赖复杂的命令行操作

2025-07-31

别再乱选了！Dify、Coze 与 n8n 的真实差距，多数人没看透

2025-07-31

Coze开源，能否挑战LangChain主导地位？

2025-07-31

扣子开源，三天揽获1.5W GitHub Star

2025-07-31

官方AMA：扣子为什么要开源？

2025-07-31

Coze开源文档资料清单

2025-07-31

手把手教你本地部署！京东JoyAgent全攻略：从零拥有一个企业级的AI Agent

2025-07-31

扣子罗盘（Coze Loop）开源版本地部署，构建一站式AI Agent调试、评估、监控平台

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

实测Qwen3-Coder，这就是目前最强的开源编程模型

2025-07-23

看大厂PM，如何玩转多个智能体开发平台

2025-06-17

53AI Hub重磅开源！让99%的智能体开发者赚到钱！

2025-06-17

Qwen3-Coder开源：面向世界的智能编程引擎

2025-07-23

Kimi K2详测，Claude国产平替有了

2025-07-14

Kimi K2 详测｜超强代码和Agent 能力！内附Claude Code邪修教程

2025-07-12

字节重磅开源！Coze Studio + Coze Loop 助力AI Agent开发与运维一体化

2025-07-27

刚刚，DeepSeek开源新版R1，媲美OpenAI最高o3模型

2025-05-29

豆包电脑版不讲武德降维打击本地部署AI知识库的开源选手

2025-05-12

事实证明千问qwen3小模型才是企业的生产力，他究竟能做什么呢？

2025-05-14

大家都在问

Coze开源，能否挑战LangChain主导地位？

2025-07-31

官方AMA：扣子为什么要开源？

2025-07-31

字节打响 Agent 平台战！Coze扣子、n8n、Dify谁是终点？

2025-07-31

更强的 Qwen3-Coder 来了，都用上了吗？

2025-07-30

Coze扣子开源后，还有好用的智能体Agent开发平台吗？

2025-07-30

扣子（Coze）开源了！你发现了哪些商业机会？

2025-07-30

GLM-4.5 发布，六大主流模型混战测评，谁能一键生成“ 真·可用 ”的应用？

2025-07-29

Coze既可开源也能本地部署，n8n和coze哪家强？

2025-07-29

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB