2.1K Star 本地实时数字人!阿里开源低延迟数字人系统,2.2秒实时响应!

最近在 GitHub 上发现一款轻量的可在本地运行的实时数字人对话系统,可摆脱之前面临的高性能硬件依赖、复杂部署和延迟问题。
它叫做 OpenAvatarChat,是一个数字人模块化系统,用于创建实时、低延迟的虚拟化身对话,可以完全在单台PC上运行,平均回答延迟仅 2.2 秒。

提供100+预置数字人形象,支持文本、音频、视频多模态交互,采用模块化架构(MiniCPM-o或ASR+LLM+TTS),渲染方式包括LiteAvatar和LAM。
支持本地推理和云端API部署,Docker一键部署简化流程。
核心功能
-
• 低延迟实时对话:实现大约2.2秒的响应延迟,与数字化身进行自然流畅的对话。 -
• 多模态交互:支持文本、音频、视频输入。 -
• 模块化架构:MiniCPM-o或ASR+LLM+TTS,灵活替换。 -
• 100+形象:预置 100+ 数字人形象,支持 LiteAvatar 和 LAM 两种渲染方式。 -
• 多种化身技术:LiteAvatar(2D化身)、LAM(从单张图像生成3D逼真化身)和MuseTalk(可定制的视频化身)。 -
• 前后端分离设计:方便自定义界面和扩展功能。 -
• 灵活部署:支持本地推理和云端 API 两种部署模式。
快速入手
在HF和魔搭平台可直接体验。
魔搭平台:https://www.modelscope.cn/studios/HumanAIGC-Engineering/open-avatar-chat

也可以通过本地源码部署或Docker来安装OpenAvatarChat。
本地源码部署
① 克隆项目
git clone https://github.com/HumanAIGC-Engineering/OpenAvatarChat.git
cd OpenAvatarChat
② 设置Python环境
python -m venv venv
source venv/bin/activate # 在Windows上:venv\Scripts\activate
③ 安装UV包管理器(推荐)
pip install uv
④ 安装依赖项
python install.py --uv --config config/chat_with_openai_compatible_edge_tts.yaml
Docker部署
git clone https://github.com/HumanAIGC-Engineering/OpenAvatarChat.git
cd OpenAvatarChat
# 生成 ssl 证书
bash scripts/create_ssl_certs.sh
# 构建并运行Docker容器
bash build_and_run.sh --config config/chat_with_openai_compatible_edge_tts.yaml
安装完依赖项后,你可以启动应用程序:
python src/demo.py --config config/chat_with_openai_compatible_edge_tts.yaml
启动后,你可以通过以下网址访问Web界面:https://localhost:8282/ui
。
实际应用场景
Open Avatar Chat的低延迟和模块化设计使其适配多种场景:
-
• 虚拟客服:为电商或企业提供24/7实时交互客服。 -
• 教育培训:创建虚拟讲师,支持语音/视频教学。 -
• 游戏开发:集成到Unity/Unreal Engine,打造NPC对话系统。 -
• 内容创作:生成短视频主播,自动配音和动画。 -
• 医疗咨询:提供虚拟健康顾问,分析用户输入并回应。
写在最后
OpenAvatarChat 最受瞩目的莫过于其 6 月发布的 v0.4.0 版本,该版本引入了 MuseTalk 支持。
这一集成标志着头像质量和真实感的一大飞跃。MuseTalk 是由 TMElyralab 开发的一项技术,为数字头像带来了更自然、更具表现力的面部动画,显著提升了它们传达情感和建立类人连接的能力。
其低延迟、多模态交互和模块化设计,以及可在单PC上运行的特性。无论从虚拟客服到游戏NPC,从教育到内容创作,都是一个很不错的实现工具。
GitHub 项目地址:https://github.com/HumanAIGC-Engineering/OpenAvatarChat
项目介绍:OpenAvatarChat——人人都能玩的「3D数字人互动平台」
你是不是也有过这些数字人相关的期待与困扰:
-
• 想做虚拟主播、线上讲师,却被专业数字人工具(如Character Creator)的高门槛和高收费劝退; -
• 用AI生成的数字人只能看静态图,没法实时对话、做表情,互动感全无; -
• 担心第三方数字人平台泄露语音数据、聊天记录,隐私安全没保障。
而OpenAvatarChat这个开源项目,就是为解决「数字人互动落地难、成本高」而生。它是一款轻量化的3D数字人实时聊天系统,支持“语音输入→AI对话→数字人语音输出+表情动作同步”全流程自动化,还能自定义数字人模型(发型、服装、五官)、调整对话风格(活泼/专业/可爱),堪称“数字人开发的平民化工具”。
无论是个人做虚拟社交、企业做智能客服,还是开发者研究数字人技术,都能靠它快速落地;更关键的是,它支持本地部署,所有数据(语音、对话记录)不上传云端,隐私安全可控,而且零费用就能解锁所有核心功能。
核心功能:4大亮点,让数字人从「好看」到「会聊」
OpenAvatarChat能在开源社区快速圈粉,靠的是「轻量易上手、互动性强、高度自定义、隐私安全」四大核心优势,精准戳中数字人用户的核心需求:
1. 实时语音对话+表情动作同步,互动感拉满
-
• 全流程自动化:用户说话后,系统自动识别语音(支持多语言)、调用AI生成对话内容(可对接GPT-4o、Claude等大模型),再通过TTS(语音合成)让数字人“开口说话”,同时同步匹配表情(如开心时微笑、疑问时皱眉)和动作(如挥手、点头),全程无需手动操作。 -
• 低延迟体验:优化语音识别、AI响应、动作驱动全链路速度,从用户说话到数字人回应,延迟控制在1-2秒内,避免对话卡顿影响体验。 -
• 多模态输入输出:除了语音,还支持文字输入(适合安静场景),数字人输出时不仅有语音,还能显示字幕,兼顾听障用户或嘈杂环境使用。
2. 数字人高度自定义,打造专属形象
-
• 模型自由更换:支持导入主流3D模型格式(如GLB、FBX),无论是卡通风格、写实风格,还是企业IP形象,都能快速替换,不用懂复杂的建模技术; -
• 细节精细调整:内置简易编辑器,可修改数字人发型、服装、肤色、五官比例,甚至调整动作幅度(如说话时手势大小),不用依赖专业设计软件; -
• 场景自定义:可添加背景场景(如办公室、直播间、户外),支持上传图片或3D场景模型,打造符合使用场景的虚拟环境(如线上讲座用教室背景,虚拟客服用企业前台背景)。
3. 零门槛部署+多平台适配,在哪都能用
-
• 本地部署超简单:支持Docker一键部署,几行命令就能在自己的电脑或服务器上搭建,无需复杂的环境配置,步骤如下: # 1. 克隆项目 git clone https://github.com/HumanAIGC-Engineering/OpenAvatarChat.git cd OpenAvatarChat # 2. 配置AI模型密钥(可选,对接自己的大模型) cp .env.example .env # 在.env文件中填写GPT-4o密钥等信息 # 3. 启动Docker容器 docker-compose up -d
-
• 多平台访问:部署后支持电脑网页端、手机浏览器访问,响应式布局适配不同屏幕尺寸,还能嵌入到企业官网、APP、小程序中,拓展使用场景(如官网虚拟客服、APP内虚拟助手)。
4. 隐私安全可控,数据自己说了算
-
• 本地数据处理:语音识别、AI对话、动作驱动等核心流程可在本地完成,语音数据、聊天记录不上传第三方平台,避免隐私泄露(尤其适合企业内部客服、医疗咨询等敏感场景); -
• 权限精细控制:支持设置管理员、普通用户等角色,限制数字人使用权限(如仅允许特定人员修改模型、查看对话记录),保障系统安全。
使用方法:3步搭建专属数字人聊天系统
1. 部署系统(以Docker为例)
-
• 确保本地安装Docker和Docker Compose,执行前文提到的克隆项目、配置密钥、启动容器命令; -
• 启动后访问 http://localhost:8080
(默认端口),按照页面引导完成初始化(如选择默认数字人模型、设置AI对话风格)。
2. 自定义数字人形象
-
• 进入「数字人管理」页面,点击「导入模型」,上传本地GLB/FBX模型,或选择系统内置模型; -
• 点击「编辑形象」,调整发型、服装等细节,预览满意后保存,数字人形象立即生效。
3. 启动互动对话
-
• 在首页点击「开始聊天」,选择输入方式(语音/文字): -
• 语音输入:点击麦克风图标说话,系统自动识别并让数字人回应; -
• 文字输入:在输入框打字,数字人会生成语音和动作回应;
-
-
• 可在「设置」中调整对话风格(如“专业严谨”“活泼可爱”)、语音合成音色(如男声/女声/童声),优化互动体验。
优势对比:OpenAvatarChat vs 主流数字人工具
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
OpenAvatarChat的核心竞争力在于「平衡」:既有能落地的实时互动功能,又不用付出高额成本,还能保障隐私安全,完美填补了“个人/中小团队数字人开发”的空白。
总结
在数字人从“概念”走向“实用”的当下,OpenAvatarChat用「开源免费+轻量易上手」的组合,让更多人能触达数字人技术——不用懂建模、不用花大价钱,就能打造会说话、会互动的专属数字人。无论是个人做兴趣创作(如虚拟博主),还是企业降本增效(如虚拟客服替代人工),它都能成为高效工具。
目前项目还在持续更新,开发者计划新增“多人同时互动”“数字人直播推流”等功能,未来场景会更丰富。如果你对数字人感兴趣,或是有虚拟互动需求,不妨试试OpenAvatarChat,让数字人从“遥不可及”变成“触手可及”。
项目地址:
https://github.com/HumanAIGC-Engineering/OpenAvatarChat