-
本项目基于清华大学开源模型chatGLM-6B以及vits框架
-
主要参考https://github.com/ruoqiu6/chat-with-Elysia2.0.git 和 https://github.com/OpenTalker/SadTalker
-
chatGLM-6B模型为清华大学开源,使用时请注意查看对应的使用需知,严格遵守使用规定
-
vits模型来自up主“saya睡大觉中”,严禁商用
- 下载后请将模型以及配置文件放在./model-vits路径下
- 内部含有多种模型,可根据自己的需求进行选择 选择参数在soundmaker.py中的self.speaker_choice中进行修改
-
Sadtalker模型下载参考https://github.com/OpenTalker/SadTalker
- 模型下载:bash scripts/download_models.sh
-
-
自行部署项目时,使用下面命令以安装模块,注意:pip安装的torch可能为cpu版本,请按照torch官网的安装方式安装对应的cuda版本,如果出现模块兼容性问题,请使用python3.9.6
pip install -r requirements.txt
-
运行项目时,使用 python main.py 即可运行
在运行main文件后,按顺序,填写问题,提供人物图片,生成对话,生成对话视频
模型全文包括参数等存于链接:https://pan.baidu.com/s/1JPsijA4muq8rGsxUykrfrg?pwd=2zot 提取码:2zot
- Demo视频参考
参考:
[1]https://github.com/ruoqiu6/chat-with-Elysia2.0.git
[2]https://github.com/THUDM/ChatGLM-6B
[3]https://github.com/datawhalechina/prompt-engineering-for-developers
[4]https://github.com/imClumsyPanda/langchain-ChatGLM
[5]https://github.com/OpenTalker/SadTalker
[6]https://huggingface.co/spaces/zomehwh/vits-uma-genshin-honkai