马上短剧生成系统,只需一个主题词,自动生成剧本、自动生成分镜、自动生成图片、自动生成视频,需要多少集,自由设定,实现角色、环境、声音的一致性。
这是个开源且免费的短剧生产力工具!非常英语出品
开源地址:https://github.com/frank36512/horseplay
单文件打包 exe 下载地址:https://pan.quark.cn/s/becdf8427ee9
使用 python 开发,只需要打包源码成为 exe 文件就可以直接运行,不需要下载依赖,也不需要任何运行库。可以直接下载打包好的 exe 文件,就可以用,甚至无需安装、无需注册。
📖 简介
马上短剧生成系统 (Horseplay) 是一款旨在革新短剧创作流程的综合性工具。通过集成最先进的 AI 模型(涵盖剧本创作、角色设计、图像生成、视频合成及语音合成),工具致力于赋能创作者,以极高的效率生产高质量的内容。
无论您是独立创作者还是制作团队,本工具都能帮助您保持角色一致性、生成动态的视觉叙事,并实现音画的完美同步。
✨ 核心功能
📝 智能剧本管理
- 支持输出主题词生成短剧剧本,也支持输出小说或文章、段子改编成短剧
- AI 辅助写作:利用强大的大语言模型(OpenAI, DeepSeek)生成剧本、对话和场景描述,自动生成分镜
- 格式标准化:自动将剧本格式化为行业标准的剧本格式
- 分集管理:想生成几集就生成几集,只需要输入一个数字
🎨 双一致性系统(角色一致性和环境一致性)
- 档案管理:定义详细的角色特征、外貌和背景故事
- 参考图管理:上传并管理参考图像,确保生成媒体中的视觉一致性
- 不仅实现角色一致性,也实现环境一致性,避免 “抽卡”,节省大量费用
🎥 AI 视频生成
- 多模型支持:集成顶尖视频生成模型,如 Google Veo, Sora, Runway, 和 Stable Video Diffusion
- 文 / 图生视频:直接根据剧本描述或分镜图像生成视频
🗣️ 音频合成
- TTS 集成:支持 ElevenLabs, OpenAI TTS, 和 Edge TTS,生成逼真的角色语音
- 音效生成:自动生成符合场景氛围的背景音乐和音效
- 自动配音:通过调用 AI 接口,自动生成高质量、富有感情的对话或旁白
- 声音一致性:通过内置参数调优,实现声音一致性
🎬 可视化分镜
- 场景可视化:使用 DALL-E 3 或 Stable Diffusion 将剧本场景转化为可视化分镜
- 镜头规划:在视频生成前规划摄像机角度和运镜
- 分镜参数个性化:内置多种分镜参数,简单方便,提升视频可控性
🛠️ 技术栈
- 语言:Python 3.10+
- GUI 框架:PyQt6(现代且响应迅速的界面)
- AI 模型与 API:
- LLM:OpenAI GPT-4, DeepSeek
- 图像:DALL-E 3, Stable Diffusion
- 视频:Google Veo, OpenAI Sora, Runway Gen-2/3
- 音频:OpenAI TTS, ElevenLabs
- 媒体处理:FFmpeg, OpenCV, Pydub
- 数据管理:基于 JSON 的项目结构
📂 项目结构
plaintext
e:\play_tool\
├── src/ # 源代码
│ ├── ui/ # 用户界面 (PyQt6)
│ ├── core/ # 核心业务逻辑 (剧本, 角色)
│ ├── ai_engine/ # AI引擎接口 (LLM, 图像, 视频, 音频)
│ └── database/ # 数据持久化
├── resources/ # 资源与配置
│ ├── config/ # 配置文件
│ ├── projects/ # 用户项目 (Git忽略)
│ └── scenes/ # 场景资源
├── .venv/ # 虚拟环境
├── requirements.txt # 依赖列表
└── main.py # 启动入口
🚀 快速开始
前置要求
- Python 3.10+:确保安装了 Python 3.10 或以上版本
- FFmpeg:必须安装 FFmpeg 并添加到系统 PATH 环境变量中
安装步骤
- 克隆仓库
plaintext
git clone https://github.com/frank36512/horseplay.git
cd horseplay
- 创建虚拟环境
- Windows
plaintext
python -m venv .venv
.venv\Scripts\activate
- Linux/macOS
plaintext
python3 -m venv .venv
source .venv/bin/activate
- 安装依赖
plaintext
pip install -r requirements.txt
配置指南
- 设置配置文件
- Windows
plaintext
copy resources\config\config.example.json resources\config\config.json
- Linux/macOS
plaintext
cp resources/config/config.example.json resources/config/config.json
- 添加 API 密钥:打开
resources/config/config.json并填入计划使用的服务(OpenAI, ElevenLabs, Google 等)的 API 密钥
运行应用
plaintext
python src/main.py
🗺️ 开发进度
- 第一阶段:基础建设 —— 基础 UI、项目管理、剧本编辑器
- 第二阶段:AI 核心 —— 深度集成 LLM 用于剧本创作,以及图像生成用于分镜
- 第三阶段:视频合成 —— 从分镜生成连贯视频片段的流水线
- 第四阶段:音频与同步 —— 口型同步技术(Wav2Lip)和自动混音
- 第五阶段:打磨 —— 导出通用视频格式,时间轴编辑功能