Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

如何训练一个说话人日志模型 #363

Open
wwbnjsace opened this issue Sep 23, 2024 · 4 comments
Open

如何训练一个说话人日志模型 #363

wwbnjsace opened this issue Sep 23, 2024 · 4 comments

Comments

@wwbnjsace
Copy link

如何训练一个说话人日志模型,我看只有一个预训练模型;还有训练的话对数据的要求是什么

@JiJiJiang
Copy link
Collaborator

你好,目前给出的是传统的框架:声纹模型提取embedding+聚类的方式,所以只需要一个预训练好的声纹模型即可,要训练的话也是重新finetune一下声纹模型即可,聚类算法不用改变。

@wwbnjsace
Copy link
Author

你好,目前给出的是传统的框架:声纹模型提取embedding+聚类的方式,所以只需要一个预训练好的声纹模型即可,要训练的话也是重新finetune一下声纹模型即可,聚类算法不用改变。

你好呀,做微调说话人日志微调我有几个问题:
1、我看只有bin/train.py训练代码,没有微调代码,怎么微调呢?
2、使用example/voxceleb/v2的例子可以吧?
3、做说话人日志模型微调数据准备和example/voxceleb/v2的例子的数据准备是一致的吧?

@FreedomLiX
Copy link

追问,您好,说话人日志模型,20人,每人大概需要多少语料(1000条/人)?能看到明显的效果区分效果,实际应用中的语音时长多长最好(2s-5s)?

@FreedomLiX
Copy link

追问,您好。两种范式:①把CNC的数据集 和自己若干人的数据集,合并在一起进行训练。CNC的作为陌生人。②只训练自己的数据集。两种范式,分别采用“新的人”数据作为陌生人进行测试。请问,作者有做过类似的工作没?哪种在陌生人上表现效果好?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants