2.1K Star 本地实时数字人！阿里开源低延迟数字人系统，2.2秒实时响应！

最近在 GitHub 上发现一款轻量的可在本地运行的实时数字人对话系统，可摆脱之前面临的高性能硬件依赖、复杂部署和延迟问题。

它叫做 OpenAvatarChat，是一个数字人模块化系统，用于创建实时、低延迟的虚拟化身对话，可以完全在单台PC上运行，平均回答延迟仅 2.2 秒。

提供100+预置数字人形象，支持文本、音频、视频多模态交互，采用模块化架构（MiniCPM-o或ASR+LLM+TTS），渲染方式包括LiteAvatar和LAM。

支持本地推理和云端API部署，Docker一键部署简化流程。

核心功能

• 低延迟实时对话：实现大约2.2秒的响应延迟，与数字化身进行自然流畅的对话。
• 多模态交互：支持文本、音频、视频输入。
• 模块化架构：MiniCPM-o或ASR+LLM+TTS，灵活替换。
• 100+形象：预置 100+ 数字人形象，支持 LiteAvatar 和 LAM 两种渲染方式。
• 多种化身技术：LiteAvatar（2D化身）、LAM（从单张图像生成3D逼真化身）和MuseTalk（可定制的视频化身）。
• 前后端分离设计：方便自定义界面和扩展功能。
• 灵活部署：支持本地推理和云端 API 两种部署模式。

快速入手

在HF和魔搭平台可直接体验。

魔搭平台：https://www.modelscope.cn/studios/HumanAIGC-Engineering/open-avatar-chat

也可以通过本地源码部署或Docker来安装OpenAvatarChat。

本地源码部署

① 克隆项目

git clone https://github.com/HumanAIGC-Engineering/OpenAvatarChat.git
cd OpenAvatarChat

② 设置Python环境

python -m venv venv
source venv/bin/activate  # 在Windows上：venv\Scripts\activate

③ 安装UV包管理器（推荐）

pip install uv

④ 安装依赖项

python install.py --uv --config config/chat_with_openai_compatible_edge_tts.yaml

Docker部署

git clone https://github.com/HumanAIGC-Engineering/OpenAvatarChat.git
cd OpenAvatarChat
# 生成 ssl 证书
bash scripts/create_ssl_certs.sh
# 构建并运行Docker容器
bash build_and_run.sh --config config/chat_with_openai_compatible_edge_tts.yaml

安装完依赖项后，你可以启动应用程序：

python src/demo.py --config config/chat_with_openai_compatible_edge_tts.yaml

启动后，你可以通过以下网址访问Web界面：https://localhost:8282/ui。

实际应用场景

Open Avatar Chat的低延迟和模块化设计使其适配多种场景：

• 虚拟客服：为电商或企业提供24/7实时交互客服。
• 教育培训：创建虚拟讲师，支持语音/视频教学。
• 游戏开发：集成到Unity/Unreal Engine，打造NPC对话系统。
• 内容创作：生成短视频主播，自动配音和动画。
• 医疗咨询：提供虚拟健康顾问，分析用户输入并回应。

写在最后

OpenAvatarChat 最受瞩目的莫过于其 6 月发布的 v0.4.0 版本，该版本引入了 MuseTalk 支持。

这一集成标志着头像质量和真实感的一大飞跃。MuseTalk 是由 TMElyralab 开发的一项技术，为数字头像带来了更自然、更具表现力的面部动画，显著提升了它们传达情感和建立类人连接的能力。

其低延迟、多模态交互和模块化设计，以及可在单PC上运行的特性。无论从虚拟客服到游戏NPC，从教育到内容创作，都是一个很不错的实现工具。

GitHub 项目地址：https://github.com/HumanAIGC-Engineering/OpenAvatarChat

项目介绍：OpenAvatarChat——人人都能玩的「3D数字人互动平台」

你是不是也有过这些数字人相关的期待与困扰：

• 想做虚拟主播、线上讲师，却被专业数字人工具（如Character Creator）的高门槛和高收费劝退；
• 用AI生成的数字人只能看静态图，没法实时对话、做表情，互动感全无；
• 担心第三方数字人平台泄露语音数据、聊天记录，隐私安全没保障。

而OpenAvatarChat这个开源项目，就是为解决「数字人互动落地难、成本高」而生。它是一款轻量化的3D数字人实时聊天系统，支持“语音输入→AI对话→数字人语音输出+表情动作同步”全流程自动化，还能自定义数字人模型（发型、服装、五官）、调整对话风格（活泼/专业/可爱），堪称“数字人开发的平民化工具”。

无论是个人做虚拟社交、企业做智能客服，还是开发者研究数字人技术，都能靠它快速落地；更关键的是，它支持本地部署，所有数据（语音、对话记录）不上传云端，隐私安全可控，而且零费用就能解锁所有核心功能。

核心功能：4大亮点，让数字人从「好看」到「会聊」

OpenAvatarChat能在开源社区快速圈粉，靠的是「轻量易上手、互动性强、高度自定义、隐私安全」四大核心优势，精准戳中数字人用户的核心需求：

1. 实时语音对话+表情动作同步，互动感拉满

• 全流程自动化：用户说话后，系统自动识别语音（支持多语言）、调用AI生成对话内容（可对接GPT-4o、Claude等大模型），再通过TTS（语音合成）让数字人“开口说话”，同时同步匹配表情（如开心时微笑、疑问时皱眉）和动作（如挥手、点头），全程无需手动操作。
• 低延迟体验：优化语音识别、AI响应、动作驱动全链路速度，从用户说话到数字人回应，延迟控制在1-2秒内，避免对话卡顿影响体验。
• 多模态输入输出：除了语音，还支持文字输入（适合安静场景），数字人输出时不仅有语音，还能显示字幕，兼顾听障用户或嘈杂环境使用。

2. 数字人高度自定义，打造专属形象

• 模型自由更换：支持导入主流3D模型格式（如GLB、FBX），无论是卡通风格、写实风格，还是企业IP形象，都能快速替换，不用懂复杂的建模技术；
• 细节精细调整：内置简易编辑器，可修改数字人发型、服装、肤色、五官比例，甚至调整动作幅度（如说话时手势大小），不用依赖专业设计软件；
• 场景自定义：可添加背景场景（如办公室、直播间、户外），支持上传图片或3D场景模型，打造符合使用场景的虚拟环境（如线上讲座用教室背景，虚拟客服用企业前台背景）。

3. 零门槛部署+多平台适配，在哪都能用

• 本地部署超简单：支持Docker一键部署，几行命令就能在自己的电脑或服务器上搭建，无需复杂的环境配置，步骤如下：

# 1. 克隆项目
git clone https://github.com/HumanAIGC-Engineering/OpenAvatarChat.git
cd OpenAvatarChat

# 2. 配置AI模型密钥（可选，对接自己的大模型）
cp .env.example .env
# 在.env文件中填写GPT-4o密钥等信息

# 3. 启动Docker容器
docker-compose up -d

• 多平台访问：部署后支持电脑网页端、手机浏览器访问，响应式布局适配不同屏幕尺寸，还能嵌入到企业官网、APP、小程序中，拓展使用场景（如官网虚拟客服、APP内虚拟助手）。

4. 隐私安全可控，数据自己说了算

• 本地数据处理：语音识别、AI对话、动作驱动等核心流程可在本地完成，语音数据、聊天记录不上传第三方平台，避免隐私泄露（尤其适合企业内部客服、医疗咨询等敏感场景）；
• 权限精细控制：支持设置管理员、普通用户等角色，限制数字人使用权限（如仅允许特定人员修改模型、查看对话记录），保障系统安全。

使用方法：3步搭建专属数字人聊天系统

1. 部署系统（以Docker为例）

• 确保本地安装Docker和Docker Compose，执行前文提到的克隆项目、配置密钥、启动容器命令；
• 启动后访问 http://localhost:8080（默认端口），按照页面引导完成初始化（如选择默认数字人模型、设置AI对话风格）。

2. 自定义数字人形象

• 进入「数字人管理」页面，点击「导入模型」，上传本地GLB/FBX模型，或选择系统内置模型；
• 点击「编辑形象」，调整发型、服装等细节，预览满意后保存，数字人形象立即生效。

3. 启动互动对话

• 在首页点击「开始聊天」，选择输入方式（语音/文字）：
- • 语音输入：点击麦克风图标说话，系统自动识别并让数字人回应；
- • 文字输入：在输入框打字，数字人会生成语音和动作回应；
• 可在「设置」中调整对话风格（如“专业严谨”“活泼可爱”）、语音合成音色（如男声/女声/童声），优化互动体验。

优势对比：OpenAvatarChat vs 主流数字人工具

工具类型	优势	劣势
OpenAvatarChat	开源免费、零门槛部署、实时互动、本地数据处理	暂不支持复杂肢体动作（如舞蹈）
专业数字人平台（如科大讯飞数字人）	功能丰富、动作精细、有客服支持	收费高（年费几万起）、依赖第三方平台
简易数字人生成工具（如某AI绘画数字人）	生成快、操作简单	仅静态模型、无互动功能
自研数字人系统	高度定制化	开发成本高、周期长、需专业团队

OpenAvatarChat的核心竞争力在于「平衡」：既有能落地的实时互动功能，又不用付出高额成本，还能保障隐私安全，完美填补了“个人/中小团队数字人开发”的空白。

总结

在数字人从“概念”走向“实用”的当下，OpenAvatarChat用「开源免费+轻量易上手」的组合，让更多人能触达数字人技术——不用懂建模、不用花大价钱，就能打造会说话、会互动的专属数字人。无论是个人做兴趣创作（如虚拟博主），还是企业降本增效（如虚拟客服替代人工），它都能成为高效工具。

目前项目还在持续更新，开发者计划新增“多人同时互动”“数字人直播推流”等功能，未来场景会更丰富。如果你对数字人感兴趣，或是有虚拟互动需求，不妨试试OpenAvatarChat，让数字人从“遥不可及”变成“触手可及”。

项目地址：

https://github.com/HumanAIGC-Engineering/OpenAvatarChat

Coze + Photoshop 自动抠图蒙版完整指南

我将为你详细讲解从基础到高级的完整操作流程。

第一部分：Coze平台抠图详解

1.1 Coze账号设置与准备工作

步骤1：注册与登录

访问 Coze.cn 或国际版 Coze.com
使用手机号或邮箱注册账号
完成实名认证（国内版需要）

步骤2：进入工作流界面

导航路径：首页 → 工作流 → 新建工作流
→ 命名工作流（如"自动抠图流程"）
→ 选择"图像处理"模板

1.2 配置抠图工作流

基础抠图配置：

工作流结构：
1. 输入节点：上传图片/接收URL
2. 处理节点：AI抠图
3. 输出节点：下载/保存

详细参数设置：

输入设置：

支持格式：JPG、PNG、WEBP（最大20MB）
分辨率建议：72-300 DPI
支持批量上传（最多50张）

AI抠图节点配置：

抠图类型选择：
├── 人像抠图（适合人物、毛发）
├── 商品抠图（适合电商产品）
├── 通用抠图（风景、动物等）
└── 精细抠图（高精度模式）

高级参数：
├── 边缘平滑：0-100（建议80）
├── 背景检测：自动/手动
├── 容差设置：15-30
└── 输出格式：PNG-24（带透明度）

1.3 运行与导出

执行工作流：

点击”运行测试”按钮
上传样例图片
查看处理日志
预览抠图效果

质量检查要点：

边缘是否平滑自然
复杂区域（如发丝）处理效果
透明背景是否干净
有无残留背景色

第二部分：Photoshop蒙版精细化处理

2.1 准备工作环境

PS基础设置：

首选项调整：
编辑 → 首选项 → 性能
├── 内存使用：70-80%
├── 历史记录状态：100
├── 缓存级别：4
└→ 确定重启PS

工作区配置：

打开：窗口 → 工作区 → 摄影
必备面板：图层、通道、路径、历史记录

2.2 导入Coze抠图结果

方法A：直接拖拽

从文件夹拖拽PNG到PS界面
自动创建为智能对象
保持透明背景

方法B：文件菜单导入

文件 → 打开 → 选择coze_output文件夹
→ 选择所有PNG文件
→ 以图层形式打开

2.3 蒙版精细化处理

创建基础蒙版：

// 快速蒙版创建步骤
1. 选择图层 → 图层面板
2. 点击"添加图层蒙版"按钮
3. 自动基于透明度创建蒙版

蒙版优化技巧：

边缘细化：

操作路径：
选择 → 选择并遮住
├── 视图模式：叠加
├── 边缘检测：智能半径 √
├── 半径：2-5像素
├── 平滑：3-5
├── 羽化：0.5像素
└→ 输出到：图层蒙版

细节修复工具：

画笔工具设置：
├── 蒙版画笔：黑色/白色
├── 硬度：80-90%
├── 不透明度：100%
├── 流量：100%
└── 快捷键：B（画笔）X（切换前景背景色）

2.4 高级蒙版技巧

复杂边缘处理：

// 发丝级精修流程
1. 进入快速蒙版模式 (Q)
2. 使用柔边画笔绘制选区
3. 退出快速蒙版 (Q)
4. 调整边缘：智能半径 10-15px
5. 净化颜色：勾选，数量 80%

通道蒙版技法：

通道抠图步骤：
1. 窗口 → 通道
2. 复制对比最强的通道
3. Ctrl+L 调色阶增强对比
4. Ctrl+点击通道缩略图载入选区
5. 回到图层面板添加蒙版

第三部分：自动化批量处理

3.1 Coze批量配置

创建批量工作流：

批量处理配置：
输入：
├── 类型：文件夹
├── 路径：/input_images/
├── 过滤：*.jpg,*.png
└── 递归：是

处理：
├── 并行任务：5
├── 超时时间：300秒
├── 错误继续：是
└── 结果合并：zip打包

输出：
├── 格式：PNG
├── 命名：原文件名_mask
├── 路径：/output_masks/
└── 质量：100%

3.2 Photoshop动作录制

创建抠图优化动作：

动作录制步骤：
1. 窗口 → 动作 → 新建动作组
2. 新建动作 → 命名"Coze优化"
3. 开始录制（红色按钮）

操作序列：
├── 文件 → 打开
├── 选择 → 全部图层
├── 图层 → 图层蒙版 → 显示全部
├── 选择 → 色彩范围 → 高光
├── 蒙版 → 反相
├── 滤镜 → 其他 → 最小值 1px
└→ 文件 → 存储为 PSD

停止录制 → 保存动作

3.3 批处理脚本

PS批处理配置：

// 批处理对话框设置
文件 → 自动 → 批处理

播放：
├── 组：默认动作
├── 动作：Coze优化

源：
├── 文件夹：coze_output
├── 覆盖动作中的打开命令 ✓
├── 包含所有子文件夹 ✓
└── 禁止颜色配置文件警告 ✓

目标：
├── 文件夹：final_psd
├── 覆盖动作中的存储为命令 ✓
├── 文件命名：文档名_优化
└→ 错误：日志并继续

第四部分：质量控制与问题解决

4.1 常见问题处理

Coze抠图问题：

问题1：边缘锯齿
解决方案：增加边缘平滑度，输出分辨率提高

问题2：背景残留
解决方案：调整容差参数，使用手动背景选择

问题3：细节丢失
解决方案：切换精细模式，分区域抠图

PS蒙版问题：

问题1：蒙版边缘生硬
解决：羽化0.5-1px，使用模糊工具柔化

问题2：颜色溢出
解决：图层 → 修边 → 去边1-2px

问题3：蒙版破碎
解决：滤镜 → 杂色 → 中间值1px

4.2 质量检查清单

抠图质量指标：

主体完整无缺失
边缘自然无锯齿
复杂区域细节保留
透明背景纯净
文件大小合理

蒙版质量标准：

蒙版边缘平滑
无背景色残留
细节层次丰富
可二次编辑
兼容多种背景

第五部分：高级应用场景

5.1 电商产品图

# 电商抠图专用流程
Coze设置：
├── 类型：商品抠图
├── 边缘：95
├── 去阴影：是
└── 输出：PNG-24

PS优化：
├── 统一画布尺寸
├── 添加标准阴影
├── 颜色校正
└── 批量导出Web格式

5.2 人像精修

# 人像专用流程
Coze设置：
├── 类型：人像抠图
├── 发丝优化：是
├── 身体识别：是
└── 半透明处理：是

PS精修：
├── 发丝细节修复
├── 边缘羽化处理
├── 肤色统一
└── 背景融合测试

5.3 建立模板库

创建预设文件：

模板库结构：
coze_templates/
├── 人像工作流.json
├── 商品工作流.json
└── 风景工作流.json

psd_templates/
├── 电商产品.psd
├── 人像精修.psd
├── 创意合成.psd
└── 动作集.atn

这个完整指南涵盖了从基础操作到高级技巧的所有细节。建议先从小批量图片开始练习，熟练掌握后再进行大规模批量处理。需要某个特定环节的更详细说明吗？

即梦 4.0 + 海螺 AI：双人平面炫酷打斗短视频全流程实操教程

大家好我是杨老师专注于爆款短视频创作与批量化提示词生产的全职硬核 AIGC 知识博主。近期打斗类短视频热度飙升，这类内容视觉冲击力强、吸睛效果好，今天就带大家从零开始，用 豆包、智谱清言、Lovart、即梦 4.0、海螺、剪映 等工具，打造 “关羽 VS 曹操” 双人平面炫酷打斗短视频。本教程为初阶内容，聚焦基础双人平面打斗效果，后续会更新高阶 3D 打斗、镜头运镜等进阶技巧，跟着步骤走，新手也能轻松上手！

一、创作全流程总览

整个制作链路遵循 “从静态到动态、从脚本到成品” 的逻辑，共 5 个核心环节，各环节工具与目标明确，可按需灵活替换同类工具：

定妆照生成：用豆包 / 即梦等工具，确定两个打斗角色的核心形象（如关羽、曹操的服装、武器、风格）。
分镜与首尾帧设计：用智谱清言生成打斗脚本（分镜）和首尾帧提示词，规划视频节奏与画面重点。
关键帧图片生成：用 Lovart / 豆包 / 即梦 4.0，根据分镜生成 6-8 张打斗关键场景静态图（含动作、场景、互动）。
图生视频：用海螺 AI 的 “前后帧” 功能，将静态关键帧转化为连贯的动态打斗镜头。
视频剪辑：用剪映串联镜头、添加音效音乐，优化视频流畅度与氛围感。

二、分步实操详解

1. 第一步：人物定妆照生成（核心：确定角色 “视觉身份”）

定妆照是后续所有创作的基础，需明确角色的外貌、服装、武器、风格，确保两个角色形象差异化且适配打斗场景。推荐用豆包生成（国内访问便捷，细节把控精准）。

1.1 工具与地址

工具：豆包（图像生成功能）
地址：https://www.doubao.com/chat/

1.2 实操步骤

打开豆包，点击输入框下方 “生成图片”，切换至图像生成模式。
分别输入关羽、曹操的定妆照提示词（提示词需包含 “风格、造型、细节、背景、比例”5 大核心要素，确保生成效果可控）：
- 关羽定妆照提示词：
  
  图片：关羽；风格：OC 渲染，CG 特效，C4D，Q 版（整体偏硬朗，符合武将打斗气质）；造型：中国传奇战士，全身照，面如重枣，丹凤眼含锐光、目光坚定，卧蚕眉斜飞入鬓，两尺墨黑长髯垂胸；身着 emerald 绿锦袍绣金色龙纹（龙纹鳞片清晰，有光泽），黑色滚边镶云纹，内罩乌金甲（甲片有金属反光质感），头戴黑色巾帻缀绿玉（绿玉通透），抛光质感头盔嵌红玛瑙（玛瑙色泽饱满），黑色战靴（靴面有褶皱细节）；武器：长柄青龙偃月刀（冷兵器，朴刀造型，刀身泛青白寒光，刀柄缠绕黑色防滑绳），双手分握刀柄不同位置（手部姿势自然，手指关节清晰）；细节：超高质量，超高细节，超分辨率，边缘无模糊；背景：干净白色背景（突出人物，便于后续换场景）；比例：16:9（适配短视频横屏）。
- 曹操定妆照提示词：
  
  图片：曹操；风格：3D，手办质感，泡泡玛特风格，C4D（与关羽风格协调，同时体现枭雄气质）；造型：中国传奇战士，中景全身照，40 岁左右，面容威严，眼神锐利，头戴王冠（王冠镶嵌宝石，有金属光泽）；服饰：crimson 红袍玉带（玉带镶嵌珠宝，红袍衣料有垂坠感），黑色战靴；武器：两把干将莫邪造型宝剑（冷兵器，剑身泛青白寒光，剑柄缠红色丝绦），双手各握一把剑（左手剑斜指地面，右手剑横于胸前）；细节：超高质量，超高细节，超分辨率，服饰纹理清晰；背景：干净白色背景；比例：16:9。
生成后检查效果：重点看 “风格统一性”（关羽 Q 版与曹操手办风是否协调）、“细节完整性”（武器寒光、甲片反光是否呈现），若不满意，可补充提示词（如 “增强关羽青龙偃月刀的寒光特效”）重新生成，满意后下载保存为 PNG 格式（背景透明，后续合成更灵活）。

2. 第二步：分镜与首尾帧提示词生成（核心：规划视频 “故事节奏”）

分镜相当于视频的 “脚本”，明确每个镜头的画面内容、时长、动作；首尾帧提示词则用于生成视频开头和结尾的关键画面，确保视频有始有终。推荐用 智谱清言（GLM-4.5 模型），逻辑输出更清晰，提示词生成更精准。

2.1 工具与地址

工具：智谱清言（GLM-4.5 模型）
地址：https://chat.z.ai/ ；备用工具：KIM、豆包（导航地址：xuxuai.top）

2.2 实操步骤

打开智谱清言，选择 “GLM-4.5” 模型（若没有，可选择 GLM-4，效果接近）。
输入分镜与首尾帧生成需求（提示词可直接复制，根据角色调整细节）：
需求：为 “Q 版关羽 VS 手办风曹操” 双人平面打斗短视频生成分镜脚本和首尾帧提示词。视频时长 15-20 秒，风格为炫酷古风打斗，突出两人武器对决（青龙偃月刀 VS 双剑），节奏紧凑。要求：
1. 分镜脚本：包含 5-6 个镜头，标注每个镜头的 “时长、画面内容、动作描述、场景氛围”；
2. 绘图提示词：为每个分镜生成对应的图片生成提示词（适配 Gemini 2.5 Flash Image 模型，需包含角色动作、场景、细节、风格）；
3. 首尾帧提示词：单独生成视频开头（两人对峙）和结尾（胜负分晓 / 收势）的画面提示词，需明确动态趋势（便于后续图生视频）。
等待输出结果：智谱清言会生成 3 类内容 ——
- 分镜脚本（例：镜头 1：0-3 秒，关羽与曹操面对面站立，中间隔 3 米，关羽横刀胸前，曹操双剑出鞘，背景为古风宫殿广场，氛围紧张）；
- 分镜绘图提示词（为每个镜头匹配精准的图片生成话术）；
- 首尾帧提示词（突出 “对峙”“收势” 的动态感，如 “首帧：关羽与曹操对峙，关羽刀身微颤，曹操双剑泛光，背景风卷落叶，动态趋势：两人即将向前迈步”）。
优化调整：若分镜节奏过慢，可提示 “压缩每个镜头时长至 2-3 秒，增加 1 个武器碰撞镜头”；若提示词细节不足，补充 “增加角色服饰褶皱、武器反光细节描述”。

3. 第三步：关键帧图片生成（核心：落地分镜 “静态画面”）

根据分镜脚本，生成 6 张左右的关键帧静态图（覆盖打斗的 “对峙 – 出招 – 碰撞 – 大招 – 收势” 全流程）。推荐 3 种方法，可根据自身工具访问权限选择：

3.1 方法一：Lovart（Gemini 2.5 Flash Image）（效果最优，需特殊网络）

Lovart 的 Gemini 2.5 模型对动态动作和场景细节的还原度极高，适合打斗类图片生成。

3.1.1 前期准备

工具：Lovart（Gemini 2.5 Flash Image 模型）
地址：https://www.lovart.ai/（需 “魔法” 访问）
临时邮箱：https://tempmaila.org/zh（用于注册 Lovart，避免泄露个人信息）

3.1.2 注册流程

打开临时邮箱网站，自动生成临时邮箱（如xxx@tempmaila.org），复制保存；
打开 Lovart，点击 “Sign Up”，选择 “Email 注册”，粘贴临时邮箱，设置密码（含大小写 + 数字，如Lovart2024!）；
返回临时邮箱，接收 Lovart 验证邮件，点击 “Verify Email” 完成激活，登录账号。

3.1.3 生图实操

登录后，点击 “Image Generator”，选择 “Gemini 2.5 Flash Image” 模型；
基础设置：比例 16:9，质量 “High”，风格输入 “OC 渲染 + C4D+Q 版（关羽）+ 手办风（曹操）”；
上传素材：将第一步生成的关羽、曹操定妆照上传（帮助模型锁定角色形象）；
输入提示词：将智谱清言生成的 “分镜绘图提示词” 逐句粘贴，同时补充统一要求：

基于上传的关羽、曹操定妆照，生成对应分镜图片，要求：1. 严格保持角色形象一致性（服装、武器、外貌不变）；2. 动作符合物理逻辑（如挥刀时手臂角度自然，跳跃时重心稳定）；3. 场景统一为古风战场 / 宫殿广场，光影协调；4. 超高质量，细节清晰（甲片、武器、服饰纹理可见）。
生成与优化：
- 单张生成：输入 1 个分镜提示词，点击 “Generate”，等待 1-3 分钟；
- 效果优化：若打斗不够激烈，补充提示词 “增强动作幅度，添加武器碰撞火花、刀光剑影特效”；若场景单一，添加 “场景增加碎石、断旗、烟雾，丰富层次感”；
- 补充镜头：生成基础 6 张后，可提示 “补充 1 张关羽刀劈地面的特写镜头、1 张曹操双剑交叉防御的空景镜头”，让画面更流畅；
保存命名：满意后下载为 PNG 格式，按 “镜头 1 – 对峙.png”“镜头 2 – 出招.png” 命名，便于后续排序。

3.2 方法二：豆包生图（最便捷，国内直接用）

若无法访问 Lovart，可直接用豆包生成，操作与定妆照一致，只需将智谱清言的 “分镜绘图提示词” 复制到豆包图像生成框，选择 “超高清” 模式，生成后按上述标准检查优化即可（优势：无需特殊网络，操作简单；不足：动态动作还原度略逊于 Lovart）。

3.3 方法三：即梦 4.0（最高效，一张图生成多分镜）

即梦 4.0 的核心优势是 “上传 1 张定妆照，自动生成多分镜”，适合追求效率的用户。

3.3.1 工具与地址

工具：即梦 4.0（剪映旗下 AI 生图工具）
地址：https://jimeng.jianying.com/

3.3.2 实操步骤

打开即梦 4.0，点击 “图文生成”，选择 “多分镜生成”；
上传素材：上传关羽或曹操的定妆照（任选一张，模型会自动匹配另一角色形象）；
输入提示词：将 Lovart 的分镜提示词稍作修改（适配即梦风格，例：“生成关羽 VS 曹操打斗多分镜，包含对峙、挥刀、双剑碰撞、大招、收势 5 个镜头，风格为 OC 渲染 + C4D，场景为古风战场，动作激烈，细节清晰”）；
生成与筛选：点击 “生成”，即梦会自动输出 8-10 张多分镜图片，筛选出与分镜脚本匹配的 6 张，下载保存即可。

4. 第四步：图生视频（核心：让静态图 “动起来”）

用海螺 AI 的 “前后帧” 功能，将关键帧图片按顺序转化为连贯的动态打斗视频，核心是利用 “首尾帧提示词” 引导动作流畅度。

4.1 工具与地址

工具：海螺 AI（图生视频功能）
地址：https://hailuoai.com/video

4.2 实操步骤

打开海螺 AI，点击 “图生视频”，选择 “前后帧生成”（即 “前一张图为起始帧，后一张图为结束帧，自动生成中间过渡动画”）；
按分镜顺序操作：
- 第一步：上传 “镜头 1 – 对峙.png” 作为 “前帧”，“镜头 2 – 出招.png” 作为 “后帧”，粘贴智谱清言生成的 “首帧提示词”（修改为动态描述，例：“前帧：关羽横刀对峙，后帧：关羽挥刀向前，过渡动画：刀身带寒光，手臂自然摆动，动作流畅”）；
- 第二步：设置参数：时长 2-3 秒，帧率 24fps（保证流畅），风格 “古风打斗，特效增强”；
- 第三步：点击 “生成”，等待视频输出，重复上述操作，依次生成 “镜头 2→镜头 3”“镜头 3→镜头 4” 等所有过渡视频；
排序保存：生成所有片段后，按分镜顺序命名（如 “01 – 对峙→出招.mp4”“02 – 出招→碰撞.mp4”），避免后续剪辑混乱。

5. 第五步：视频剪辑（核心：让片段 “成成品”）

用剪映串联所有动态片段，添加音效、音乐、转场，提升视频的 “炫酷感” 和 “节奏感”。

5.1 工具与地址

工具：剪映（电脑版 / 手机版均可，电脑版操作更高效）
地址：https://www.capcut.cn/（官网下载）

5.2 实操步骤

新建项目：打开剪映，新建 “16:9 横屏” 项目，导入所有海螺生成的视频片段；
粗剪串联：将片段按 “01→02→03→…→06” 顺序拖入时间轴，点击 “分割”（剪刀图标）删除每个片段首尾的冗余黑屏，确保镜头衔接连贯；
添加转场：选中相邻片段，点击 “转场”，选择 “运镜” 类转场（如 “推进”“旋转”“闪白”），时长设为 0.3-0.5 秒，避免转场过于花哨；
音效与音乐：
- 音效：在 “音效库” 搜索 “武器碰撞”“刀光剑影”“脚步声”“大招轰鸣” 等音效，拖入对应镜头（如武器碰撞时添加 “金属撞击声”，大招时添加 “轰鸣声”）；
- 音乐：选择古风燃向 BGM（如《乱世巨星》纯音乐版），拖入时间轴，音量调至 20%-30%（避免盖过音效），在视频结尾处添加 “渐弱” 效果；
细节优化：
- 滤镜：添加 “古风” 分类下的 “青墨” 滤镜（强度 30%），统一画面色调；
- 字幕：在视频开头添加 “关羽 VS 曹操巅峰对决” 标题（字体选 “书法体”，颜色金色），结尾添加 “下期更新高阶 3D 打斗” 引导语；
导出成品：点击 “导出”，设置分辨率 1080P、帧率 24fps，导出后在手机 / 电脑上预览，检查是否有卡顿、音效错位等问题，没问题即可发布。

三、工具选择建议与避坑指南

1. 工具适配表（按需求选）

需求场景	推荐工具组合	优势
追求极致打斗效果	Lovart + 海螺 + 剪映	动作还原准、细节丰富、动态流畅
国内访问、操作便捷	豆包 + 即梦 4.0 + 海螺 + 剪映	无需特殊网络，新手易上手
高效批量生产	即梦 4.0（多分镜生成）+ 海螺 + 剪映	1 张图生成多分镜，节省生图时间

2. 常见问题与解决办法

问题 1：定妆照生成后，两个角色风格不统一（如关羽 Q 版、曹操写实）？

解决：在提示词中添加 “两人风格严格统一，均为 OC 渲染 + C4D+Q 版手办风”，生成时同时上传两个角色的参考图。
问题 2：Lovart 生成图片动作变形（如关羽手臂扭曲）？

解决：在提示词中补充 “动作符合人体工学，手臂长度与身体比例 1:1.2，手指关节清晰自然”，或上传一张类似动作的参考图（如 “参考武术挥刀姿势”）。
问题 3：海螺图生视频卡顿、过渡不自然？

解决：减少单段视频时长（控制在 2 秒内），在前后帧提示词中明确 “过渡动画流畅，帧间无跳跃，人物位置保持居中”。
问题 4：剪辑后视频节奏拖沓？

解决：删除冗余片段，每个镜头时长控制在 2-3 秒，用 “闪白”“推进” 等快节奏转场，音效与动作精准匹配（如出招时同步音效）。

四、总结与后续预告

本教程通过 “定妆 – 分镜 – 生图 – 动图 – 剪辑” 5 步，完成了双人平面打斗短视频的制作，核心在于 “提示词精准控制”（确保角色、风格、动作统一）和 “镜头节奏把控”（让打斗有起承转合）。

如果觉得教程有用，记得点赞、关注、收藏！后续会更新 高阶打斗技巧：包括 3D 镜头运镜（如环绕式打斗）、角色面部表情动态（如愤怒、发力）、场景破坏效果（如地面碎裂、建筑倒塌）等。

你还想学习哪些 AI 短视频制作技巧？欢迎在评论区留言，我会优先安排教程！愿大家都能做出爆款打斗短视频，所愿皆所得！

别找了！即梦AI4.0一键生成中秋国庆10套海报模板！赢麻了！

今天把提示词送给大家，看完你就能立刻复制，提前躺赢整个双节大战。

打开即梦AI

网址https://jimeng.jianying.com/ai-tool/home，这得记好了。

创作类型选“图片生成”；模型选“图片4.0”，有文字的个人都建议用这个，也可以试试别的模型生图；比例嘛，根据自己想要的来就行。

提示词（Prompt）的编写

画面主体得写清楚，比如俯视45度，C4D超写实3D渲染。画面中心摆啥，数量、产品名称、口味、规格，都得写明白。瓶身啥主色，封口啥材质，反光不反光，都得交代清楚。产品液体或内容物咋样，是飞溅成弧形浪花，还是放射水柱，或者雪花，也得写。粒子是水珠、油滴，还是冻干粒，也别落下。瓶间散落啥点缀物，增加食欲，也得写上。品牌LOGO留白在哪儿，包装正面、罐身，还是瓶盖，也得说清楚。

标题文案也重要，主标题置顶，写啥，三维立体金属字，啥主色渐变描边，厚度多少，有没有投影，都得写。副标题置底，写啥促销文案，啥颜色，啥字体，也得交代清楚。

背景环境也不能马虎，场景关键词得有，俯瞰啥远景，啥氛围元素，整体冷暖调，明亮不明亮，饱和度高不高，营造啥情绪，清爽、健康，还是高端，都得写清楚。

光影材质也得注意，三点布光配合啥时间的HDRI阳光，主光啥色温，侧逆光不侧逆光，瓶身材质啥材质，高光反射不反射，液体SSS次表面散射，背景PBR真实质感，都得写明白。

构图张力也不能忽视，俯视啥焦距，广角透视不广角透视，飞溅的液体或粒子形成啥引导线，锁定中心产品，主色对比，画面张力，都得写清楚。

系统一次会返回4张预览图：如果一眼相中，点“超清”按钮，等个3–5秒就能得到超清后的图片；右上角有“下载”图标，一键保存到本地就行。

不是AI替你下班，而是让你带着AI提前下班。

别犹豫，别人还在熬夜改图，你已经用AI助力，拎着行李在检票口了。

中秋国庆，我们不当加班狗。

如果这篇教程对你有用，别忘了动动手指点个“赞”、戳个“爱心”，再顺手点个关注，也可以分享给身边的朋友，咱们不见不散！

文中海报提示词送给大家，【】内容可自行修改：

第1组：中秋月饼礼盒（食品类）

画面主体
俯视45度，C4D超写实3D渲染。画面中心摆放【双层鎏金月饼礼盒】，盒身【深红哑光材质】，封口【金色浮雕纹样】反光；【莲蓉馅料】自礼盒飞溅成【弧形浪花】，【粒子：糖粒与桂花碎】定格空中；盒间散落【金箔、月饼模具、竹制茶具】，增加食欲；品牌LOGO留白于【包装正面】。
标题文案
主标题置顶「月满中秋礼遇臻品」三维立体金属字，【金-红渐变描边】，厚度4毫米，轻微投影；副标题置底「满赠限定茶具一套」白字【深红】条横幅，方正超粗黑体。
背景环境
【中式庭院俯瞰】远景：【月亮灯笼】、【水墨屏风】，整体【暖色调】明亮，饱和度极高，营造【高端典雅】氛围。
光影材质
三点布光配合【夜景】HDRI月光，主光【暖黄】侧逆光，礼盒材质【哑光纸艺+烫金】高光反射，馅料SSS次表面散射，背景PBR真实质感。
构图张力
俯视35毫米焦距，轻微广角透视，飞溅【馅料粒子】形成【S形】引导线，锁定中心产品；主色【深红、鎏金、墨黑】对比，画面张力十足。

第2组：国风护肤品礼盒（美妆类）

画面主体
俯视45度，C4D超写实3D渲染。画面中心摆放【青花瓷瓶精华液】，瓶身【天青釉色陶瓷】，封口【金属雕花盖】反光；【精华液】自瓶口飞溅成【放射水柱】，【粒子：金箔与花瓣】定格空中；瓶间散落【玉石梳、丝绸布、干花】，增加奢华感；品牌LOGO留白于【瓶身侧面】。
标题文案
主标题置顶「国庆臻礼焕颜新生」三维立体金属字，【青金渐变描边】，厚度4毫米，轻微投影；副标题置底「买赠定制玉石按摩器」白字【深蓝】条横幅，方正超粗黑体。
背景环境
【古典案台俯瞰】远景：【卷轴书画】、【香炉烟缕】，整体【冷色调】明亮，饱和度极高，营造【清雅高端】氛围。
光影材质
三点布光配合【清晨】HDRI柔光，主光【中性白】侧逆光，瓶身材质【陶瓷釉面】高光反射，液体SSS次表面散射，背景PBR真实质感。
构图张力
俯视35毫米焦距，轻微广角透视，飞溅【精华液】形成【对角线】引导线，锁定中心产品；主色【天青、金、白】对比，画面张力十足。

第3组：气泡果酒饮料（饮品类）

画面主体
俯视45度，C4D超写实3D渲染。画面中心摆放【四排玻璃瓶气泡果酒】，瓶身【透明玻璃】，封口【铝制拉环】反光；【气泡酒液】自瓶口飞溅成【弧形浪花】，【粒子：果肉与气泡】定格空中；瓶间散落【冰塊、柠檬片、薄荷叶】，增加清爽感；品牌LOGO留白于【瓶身标签】。
标题文案
主标题置顶「国庆派对气泡狂欢」三维立体金属字，【橙-粉渐变描边】，厚度4毫米，轻微投影；副标题置底「第二件半价」白字【亮橙】条横幅，方正超粗黑体。
背景环境
【泳池派对俯瞰】远景：【霓虹灯牌】、【冲浪板】，整体【暖色调】明亮，饱和度极高，营造【活力清爽】氛围。
光影材质
三点布光配合【正午】HDRI阳光，主光【暖黄】侧逆光，瓶身材质【高透玻璃】高光反射，液体SSS次表面散射，背景PBR真实质感。
构图张力
俯视35毫米焦距，轻微广角透视，飞溅【酒液】形成【放射形】引导线，锁定中心产品；主色【透明橙、亮蓝、银白】对比，画面张力十足。

第4组：限定电子耳机（电子产品）

画面主体
俯视45度，C4D超写实3D渲染。画面中心摆放【红色国潮限定耳机】，机身【哑光红漆面】，接口【镀金材质】反光；【音波能量】自耳机喷涌成【放射光柱】，【粒子：光电粒子与音符】定格空中；耳机间散落【中国结、电路板纹样、烟花特效】，增加科技国风感；品牌LOGO留白于【耳机侧面】。
标题文案
主标题置顶「国庆视听盛宴」三维立体金属字，【红-金渐变描边】，厚度4毫米，轻微投影；副标题置底「限量赠国风定制盒」白字【金色】条横幅，方正超粗黑体。
背景环境
【城市夜景俯瞰】远景：【烟花绽放】、【霓虹大厦】，整体【冷暖对比调】明亮，饱和度极高，营造【炫酷高端】氛围。
光影材质
三点布光配合【夜景】HDRI霓虹光，主光【冷蓝】侧逆光，机身材质【磨砂金属】高光反射，光效粒子发光，背景PBR真实质感。
构图张力
俯视35毫米焦距，轻微广角透视，飞溅【光效】形成【对角线】引导线，锁定中心产品；主色【中国红、鎏金、深蓝】对比，画面张力十足。

第5组：中秋茶叶礼盒（饮品礼盒）

画面主体
俯视45度，C4D超写实3D渲染。画面中心摆放【镂空木制茶叶罐】，罐身【深褐木纹】，封口【铜制扣环】反光；【茶叶】自罐口飞溅成【弧形飘散】，【粒子：茶叶与桂花】定格空中；罐间散落【茶盏、砂壶、水墨卷轴】，增加雅致感；品牌LOGO留白于【罐盖中央】。
标题文案
主标题置顶「月下品茗礼赠知音」三维立体金属字，【棕-金渐变描边】，厚度4毫米，轻微投影；副标题置底「赠手工茶具一套」白字【深绿】条横幅，方正超粗黑体。
背景环境
【茶室俯瞰】远景：【月光竹影】、【石雕茶盘】，整体【暖棕调】明亮，饱和度极高，营造【静谧健康】氛围。
光影材质
三点布光配合【清晨】HDRI柔光，主光【暖黄】侧逆光，罐身材质【木质+金属】高光反射，茶叶颗粒质感，背景PBR真实质感。
构图张力
俯视35毫米焦距，轻微广角透视，飞溅【茶叶】形成【S形】引导线，锁定中心产品；主色【深褐、铜金、墨绿】对比，画面张力十足。

第6组：国庆限定红酒（酒类）

画面主体
俯视45度，C4D超写实3D渲染。画面中心摆放【瓶身浮雕紫葡萄红酒】，瓶身【深红玻璃】，封口【金色蜡封】反光；【酒液】自瓶口飞溅成【放射水柱】，【粒子：葡萄粒与金粉】定格空中；瓶间散落【丝绸、金币、橡木桶】，增加奢华感；品牌LOGO留白于【瓶身标贴】。
标题文案
主标题置顶「举杯国庆臻享盛宴」三维立体金属字，【红-金渐变描边】，厚度4毫米，轻微投影；副标题置底「购两瓶赠定制酒杯」白字【金色】条横幅，方正超粗黑体。
背景环境
【宴会长桌俯瞰】远景：【水晶吊灯】、【红色帷幕】，整体【暖金调】明亮，饱和度极高，营造【奢华庆典】氛围。
光影材质
三点布光配合【夜景】HDRI烛光，主光【暖橙】侧逆光，瓶身材质【高透玻璃】高光反射，酒液SSS次表面散射，背景PBR真实质感。
构图张力
俯视35毫米焦距，轻微广角透视，飞溅【酒液】形成【放射形】引导线，锁定中心产品；主色【深红、鎏金、黑】对比，画面张力十足。

创意满满！即梦4.0直出教师节创意海报（附详细提示词）

教师节到了，今天我来分享一下《如何从0开始用AI直出教师节主题海报》，桃李芬芳 · 感念师恩，祝愿老师们节日快乐、心想事成！

首先打开豆包AI的官网，按照下图中的步骤，输入类似下面的话术，直接让豆包帮我们批量生成教师节主题海报的提示词：

我现在需要用 A | 制作 8 张不同的教师节主题的海报，采用 3D渲染效果， C4D 风格质感呈现，我希望画面是极具创意并呈现童真、温馨和充满感恩之情的校园场景，整体色彩高饱
和温馨、鮮艳亮丽，风格温馨、富有貞与青春活泼气息，请你帮我设计出对应的 8 张教师兯创意海报的详细 A 画提示词，中文版！

可以看到，豆包按要求一次性给我们生成了8个教师节主题的海报提示词。

接着，就可以直接用上面的提示词生成海报了。为了有更好的视觉和创意效果，可以用新鲜出炉的AI生图新王者——即梦4.0来生成我们喜欢的海报。

下面就是我根据上面的提示词，用即梦4.0直出的9张海报，最后1张是补充的封面，详细的提示词，请查收～

1、正面视角， C4D 风格 3 D 渲染，高饱和温馨色彩（暖黄、柔粉、浅蓝为主）画面主体是一个放大 1 0 倍的木质粉笔盒盒盖半开，内部没有粉笔，而是装满童真元素： 3 个圆滚滚的卡通学生人偶（穿着蓝白校服，手举 ” 老师 ” ‘ 辛苦了 ‘ 手写小纸牌）、迷你向日葵花丛、微型黑板（上方写着 ” 谢谢 ” 下方拼音”Xie Xie”) ，粉笔盒边缘散落着几颗彩色糖果，背景是模糊的教室黑板（画着简笔彩虹），画面上方用白色手写体写着主题 ” 粉笔盒里的小世界 ” ，整体光影柔和，质感细腻（木质纹理、糖果光泽清晰），氛围童真又温暖，充满对老师的小小心意

02
斜侧 45 。视角， C4D 风格 3 D 渲染，鲜艳亮丽配色（橙红、明黄、薄荷绿为主），画面核心是由 6 本彩色硬壳课本叠成的阶梯：最底层课本印着 ” 一年级 ” ，顶层印着 ” 六年级 ” ，每本课本封面都有卡通图案（铅笔、小树苗、星星）；阶梯两侧站着 3 个 C4 D 卡通儿童（扎羊角辮、背小书包，手里捧着纸折康乃馨），正一步步往上走，阶梯顶端坐着一个温柔的卡通老师人偶（戴圆框眼镜，伸手迎接孩子），背景是飘着白云的蓝天，地面铺着彩色拼图地砖，画面上方用白色手写体写着主题 ” 书本叠成的感恩阶梯 ” ，整体风格青春活泼，隐喻老师陪伴成长的温暖主题

3、俯视视角， C4D 风格 3 D 渲染，高饱和温馨色彩（浅紫、暖橙、奶白为主）画面聚焦教室讲台：木质讲台桌面摆着 3 样物品冒着热气的保温杯（贴满学生画的小贴纸）、翻开的教案（写着 ” 教师节快乐 ” 涂鸦）、插着 3 支向日葵的陶瓷花瓶；讲台后方的黑板变成 ” 星空幕布 ” ，用荧光粉笔写着 ” 老师，我们爱您 ” ，周围画着星星、月亮、小火箭；讲台下有 5 个迷你卡通学生（趴在课桌上，举着荧光棒组成 ” 心 ” 形），教室灯光是暖黄色吊灯，地面有细碎的 ” 星光 ” 光斑，整体氛围浪漫又童真，传递感恩之情

4、近景特写视角， C4D 风格 3 D 渲染，鲜艳亮丽配色（玫红、草绿、鹅黄为主），画面主体是一片 ” 铅笔森林 ” ： 1 0 支彩色 C4D 铅笔（笔身印着笑脸、星星图案）垂直插在松软的 ” 云朵泥土 ” 里，铅笔顶端的橡皮变成小蘑菇形状；森林中央放着一张立体感谢卡（翻开状态，里面画着老师和学生手牵手的简笔画，写着 ” 谢谢您教会我们成长 ” ）；感谢卡周围散落着迷你礼物盒（系着彩色丝带）、小雏菊，背景是淡蓝色渐变，点缀着彩色气泡，画面上方用白色手写体写着主题 ” 铅笔森林里的感谢卡 ” ，整体风格可爱又温馨，突出童真感与感恩/ 心思

5、全景视角， C4D 风格 3D 渲染，高饱和温馨色彩（天蓝、粉红、浅黄为主）画面是阳光明媚的校园操场：左侧是木质秋千架，秋千上坐着卡通老师（穿浅蓝连衣裙，手里拿着故事书），地面站着 3 个卡通学生（仰着头听故事，手里拿着苹果、糖果想送给老师）；右侧是彩色滑梯（涂着彩虹图案），滑梯旁有2 个学生在追蝴蝶；背景是绿色草坪（点缀着小野花）、红色跑道，远处有教学楼（窗户里透出暖光，贴着 ” 教师节快乐 ” 的海报），天空飘着棉花糖般的白云，画面上方用白色手写体写着主题 ” 操场秋千上的师生时光 ” ，整体光影明，充满青春活泼气息，展现师生间的温馨互动6、正面平视视角， C4D 风格 3 D 渲染，鲜艳亮丽配色（深绿、明黄、粉紫为主），画面核心是一块巨大的绿色黑板：黑板左侧用白色粉笔写着 3 个长度单位换算的公式（ ” 1 千米 (km) = 1000 米（ m ） 1 米 = 100 厘米（ c m ） 1 厘米= 1 0 毫米（ m m ） ” ），但公式末尾变出了藤蔓（缠绕黑板边缘，开出粉色小花）；黑板右侧画着卡通太阳（笑脸表情），阳光照在黑板中央一一那里有一个立体 C4D 场景：小老师人偶（戴领带，站在迷你讲台上讲课），面前坐着3 个小学生人偶（举着小手提问）；黑板下方的粉笔槽里，没有粉笔，而是装满了彩色玻璃珠（像小宝石），讲台前有 2 个学生人偶（捧着一束纸折花，准备送给黑板里的老师），整体创意十足，用魔法元素体现老师的育人魔力，童真又温暖

万能视频图片解析下载

https://snapany.com/zh

GitMind AI 故事的教程

GitMind AI 故事的教程，包括如何进入及每一步的操作：

进入 GitMind AI 官网及注册登录

进入官网 ：访问GitMind AI 官网。
注册登录 ：点击 “Sign in”，可用 Google 或 Microsoft 账户登录，也可选择注册新账号。注册时需填写电子邮件地址、设置密码等信息。

创建思维导图

新建空白脑图 ：登录后，点击 “Create” 右下角的 “+” 号，选择 “Blank” 模板，再点击 “Create”，即可进入脑图编辑界面。
选择预设模板 ：若不想从空白开始，可在 “Templates” 中挑选合适模板，如 “Mind Map”“几乎是思维导图”“Idea Flow” 等，点击模板后进入编辑界面。

使用 GitMind AI 功能

联网搜索插件 ：进入任意对话界面，点击右上角模型选择，在插件栏开启 “联网搜索” 按钮。在输入框输入内容，软件大模型会根据内容自行判断是否开启联网搜索。
GitMind 脑图插件 ：在对话界面的插件栏开启 “GitMind 脑图” 按钮，在输入框输入要求通过思维导图形式输出的内容，软件会自动调用脑图插件，将生成内容以脑图形式展示。点击【编辑】按钮，还可对脑图内容进行优化和调整。
智能识图插件 ：于对话界面插件栏开启 “智能识图” 按钮，点击【上传图片】，上传图片后在输入栏输入对图片的要求，发送即可让 AI 分析解读图片。
一键生成思维导图 ：点击【我的思想】，选择【智能生成】>【AI 脑图】，输入主题内容后点击生成，AI 将自动创建思维导图。也可选中思维导图任一节点，使用 AI 助手按钮提问，AI 会生成答案或相关内容。
AI 文档转脑图 ：开启 GitMind，进入【我的思想】，点击【智能生成】，选择【AI 分析】，上传 PDF、DOC 或 PPTX 格式文档，点击 “生成”，AI 将分析文档并生成心智图。
图片转脑图 ：开启 GitMind，创建新脑图，使用 “图片转脑图” 功能，上传或贴上图片，AI 会识别图片内容并生成对应的心智图，之后可进一步编辑调整。

编辑与美化思维导图

添加节点 ：点击画布上的 “+” 号可添加新节点。
编辑节点内容 ：双击节点，即可编辑其文本。
调整节点样式 ：选中节点后，右侧会出现样式选项，可更改颜色、线条样式等。
组织节点 ：点击并拖动节点可改变位置，选择节点后点击 “关系线” 并拖动连接线到另一节点可创建连接，还可调整布局。

智能分析功能

打开思维导图文件，右上角点击 GitMind AI 图标按钮，在对话框内点击【智能分析】，AI 会对思维导图进行分析，完成后可将结论插入到思维导图中，也可继续针对分析结果提问。

保存与分享

保存：点击界面顶端的 “文件” 选项，选择 “保存” 或 “另存为”。
分享：点击 “分享” 按钮，可生成专属链接分享给他人，或导出为图片、PDF 等格式。

Deepseek+王炸组合，感受国产AI的真正实力！

国产 AI 工具组合使用攻略：释放 AI 在实际工作中的全部潜力

在上一篇推送中，我们向大家分享了 Deepseek 这一超强国产 AI 的使用技巧，深入展示了它在处理长文本、生成精确内容方面的卓越能力。然而，仅靠单一工具的使用，就如同在广阔大海中仅凭借一只小舟航行，远远无法抵达 AI 在实际工作中的全部潜力彼岸。

今天，我们将进一步深入探索，为大家详细揭秘如何巧妙地将 Deepseek 与更多 AI 工具结合，实现 1 + 1 ＞2 的惊艳效果，让我们一同跟随，真切感受国产 AI 的真正强大魅力！

一、Deepseek + 佐糖：AI 一键换背景，照片焕新轻松三步走

在日常生活中，我们常常会遇到这样的情况：手头的照片背景杂乱不堪、单调乏味，或者完全不符合特定需求，而自己又苦于没有灵感去构思更合适的背景。此时，Deepseek 与佐糖 AI 的强强联合，便能为你轻松解决这一难题。

（一）第一步：利用 Deepseek 生成精准背景描述

你只需在 Deepseek 中输入一句简洁明了的提示，例如 “北欧风情的背景提示词，描述用逗号隔开”，它便会迅速且精准地基于你的需求，生成一份丰富而详细的背景描述内容。这宛如为你打开了一扇灵感之窗，各种奇妙的背景构思瞬间跃然眼前。

（二）第二步：借助佐糖 AI 智能合成背景，开启照片焕新之旅

在获得背景描述后，打开佐糖 AI 智能合成背景功能，轻松上传照片，工具会自动进行抠图处理。此时，你还可以根据个人喜好与创意，自由灵活地调整画布大小以及照片主体的位置和大小，让照片的布局更加符合你的理想构图。

（三）第三步：一键生成，见证照片背景完美蜕变

接下来，选择「人像模板」>「自定义」选项，并将 Deepseek 提供的背景描述提示词准确输入，最后稳稳地点击生成按钮。短短几秒钟之后，AI 的强大魔力便会展现在你眼前——照片背景瞬间被智能替换，并且光影效果会自然地与人物融合，使人物和新背景宛如天成，完美贴合，让你的照片焕然一新，焕发出全新的视觉魅力。

点击这里，立即体验佐糖 AI 背景合成的神奇魅力，开启你的照片焕新之旅！

二、DeepSeek + 思乎：快速分析 & 制作思维导图，轻松掌握复杂文档核心要点

在工作与学习过程中，阅读报告、行业白皮书或研究资料是必不可少的环节。但面对几十页甚至上百页的 PDF 文档时，内容繁杂、信息量巨大，阅读起来不仅费时费力，还很难精准提取出核心信息，让人常常陷入信息过载的困境。此时，Deepseek 与思乎 GitMind 的巧妙组合，将成为你的得力助手，助你瞬间掌握重点，轻松告别信息过载的烦恼。

（一）第一步：利用 Deepseek 快速分析并提炼 PDF 文件精华

将 PDF 文件上传至 Deepseek 平台，并输入指令「分析并提炼文件内容，将核心观点生成结构化的内容，并以 Markdown 形式输出」。Deepseek 的强大 AI 算法随即启动，它会自动对文件进行全面深入的分析，精准提取出关键信息、核心观点以及重要数据，并以清晰的 Markdown 格式呈现出来，大大节省了你逐字逐句阅读原文的时间和精力。

（二）第二步：借助思乎 GitMind 一键生成逻辑清晰的思维导图

完成文件分析后，打开并登录 GitMind 思乎平台，选择「GitMind AI」>「AI 生成脑图」>「长文本」选项，将刚刚在 Deepseek 复制的结构化内容准确粘贴进去，随后点击下方的「生成脑图」按钮。思乎 AI 将迅速根据内容生成一份逻辑严谨、层次分明的思维导图，这不仅能够帮助你更加直观、清晰地梳理和理解复杂文档的脉络，还能让你在需要时，进一步利用思乎提供的内置 AI 功能，对内容进行深度追问、详细解释，甚至拓展获取更多相关资料，全方位满足你的学习与工作需求。

点击此处，立即体验思乎 AI 脑图生成的高效与便捷，开启你的思维整理之旅！

三、DeepSeek + 录咖：快速整理会议纪要，告别文山会海

在日常工作中，会议作为信息交流的关键方式，发挥着不可替代的作用。然而，会议也常常伴随着诸多问题：会议时间漫长，内容繁杂，关键信息难以精准把握；手写或手打记录速度缓慢，严重影响专注度；事后整理会议纪要更是耗时费力，还容易遗漏重要决策。针对这些痛点，Deepseek 与录咖的完美结合，将为你提供高效解决方案，让你彻底告别文山会海，轻松拿捏会议重点。

（一）第一步：运用录咖 AI 快速转录会议音频或视频

打开录咖 AI 语音转文字功能，将会议的音频或视频文件轻松上传。录咖 AI 凭借其精准的语音识别技术，能够迅速将讲话内容准确转录为文字，并且能够自动区分不同发言人的声音，同时支持多语言识别，全方位满足各类会议场景下的转录需求。

（二）第二步：借助 Deepseek 智能生成结构化会议纪要

将录咖生成的会议纪要文字内容复制粘贴到 Deepseek 平台，并输入提示词：「将对话内容转换为结构化的会议纪要，并列出待办事项」。Deepseek 的 AI 模型随即开始运作，它会自动梳理会议内容的逻辑关系，精准提取关键要点，稍等片刻，一份完整且全面的会议纪要便呈现在你眼前，不仅清晰地呈现了会议的核心内容，还将待办事项一一罗列，方便你后续跟进和落实。

点击这里，立即体验录咖音频转文字的高效功能，开启你的智能会议纪要整理之旅！

当 AI 工具们不再各自为战，而是相互配合、相互加持，它们所爆发出的强大能量将真正实现工作的事半功倍。如今，国产 AI 已经强势崛起，展现出无限的潜力与魅力。别再犹豫，赶紧行动起来，巧妙运用这些国产 AI 工具组合，让你的工作效率迈向一个全新的高度！

移动端菜单管理

主导航菜单

搜索功能

导航菜单

公考培训课程

课程中心

学历提升

关于我们

189-6968-1212

技术博客

开发工具

2.1K Star 本地实时数字人！阿里开源低延迟数字人系统，2.2秒实时响应！

核心功能

快速入手

实际应用场景

写在最后

项目介绍：OpenAvatarChat——人人都能玩的「3D数字人互动平台」

核心功能：4大亮点，让数字人从「好看」到「会聊」

1. 实时语音对话+表情动作同步，互动感拉满

2. 数字人高度自定义，打造专属形象

3. 零门槛部署+多平台适配，在哪都能用

4. 隐私安全可控，数据自己说了算

使用方法：3步搭建专属数字人聊天系统

1. 部署系统（以Docker为例）

2. 自定义数字人形象

3. 启动互动对话

优势对比：OpenAvatarChat vs 主流数字人工具

总结

Coze + Photoshop 自动抠图蒙版完整指南

Coze + Photoshop 自动抠图蒙版完整指南

第一部分：Coze平台抠图详解

1.1 Coze账号设置与准备工作

1.2 配置抠图工作流

1.3 运行与导出

第二部分：Photoshop蒙版精细化处理

2.1 准备工作环境

2.2 导入Coze抠图结果

2.3 蒙版精细化处理

2.4 高级蒙版技巧

第三部分：自动化批量处理

3.1 Coze批量配置

3.2 Photoshop动作录制

3.3 批处理脚本

第四部分：质量控制与问题解决

4.1 常见问题处理

4.2 质量检查清单

第五部分：高级应用场景

5.1 电商产品图

5.2 人像精修

5.3 建立模板库

即梦 4.0 + 海螺 AI：双人平面炫酷打斗短视频全流程实操教程

即梦 4.0 + 海螺 AI：双人平面炫酷打斗短视频全流程实操教程

一、创作全流程总览

二、分步实操详解

1. 第一步：人物定妆照生成（核心：确定角色 “视觉身份”）

1.1 工具与地址

1.2 实操步骤

2. 第二步：分镜与首尾帧提示词生成（核心：规划视频 “故事节奏”）

2.1 工具与地址

2.2 实操步骤

3. 第三步：关键帧图片生成（核心：落地分镜 “静态画面”）

3.1 方法一：Lovart（Gemini 2.5 Flash Image）（效果最优，需特殊网络）

3.1.1 前期准备

3.1.2 注册流程

3.1.3 生图实操

3.2 方法二：豆包生图（最便捷，国内直接用）

3.3 方法三：即梦 4.0（最高效，一张图生成多分镜）

3.3.1 工具与地址

3.3.2 实操步骤

4. 第四步：图生视频（核心：让静态图 “动起来”）

4.1 工具与地址

4.2 实操步骤

5. 第五步：视频剪辑（核心：让片段 “成成品”）

5.1 工具与地址

5.2 实操步骤

三、工具选择建议与避坑指南

1. 工具适配表（按需求选）

2. 常见问题与解决办法

四、总结与后续预告

别找了！即梦AI4.0一键生成中秋国庆10套海报模板！赢麻了！