如何训练一个说话人日志模型 #363

wwbnjsace · 2024-09-23T05:59:52Z

如何训练一个说话人日志模型，我看只有一个预训练模型；还有训练的话对数据的要求是什么

JiJiJiang · 2024-09-23T11:09:03Z

你好，目前给出的是传统的框架：声纹模型提取embedding+聚类的方式，所以只需要一个预训练好的声纹模型即可，要训练的话也是重新finetune一下声纹模型即可，聚类算法不用改变。

wwbnjsace · 2024-09-26T11:02:52Z

你好，目前给出的是传统的框架：声纹模型提取embedding+聚类的方式，所以只需要一个预训练好的声纹模型即可，要训练的话也是重新finetune一下声纹模型即可，聚类算法不用改变。

你好呀，做微调说话人日志微调我有几个问题：
1、我看只有bin/train.py训练代码，没有微调代码，怎么微调呢？
2、使用example/voxceleb/v2的例子可以吧？
3、做说话人日志模型微调数据准备和example/voxceleb/v2的例子的数据准备是一致的吧？

FreedomLiX · 2024-12-18T02:45:28Z

追问，您好，说话人日志模型，20人，每人大概需要多少语料（1000条/人）？能看到明显的效果区分效果，实际应用中的语音时长多长最好（2s-5s）?

FreedomLiX · 2024-12-18T02:52:22Z

追问，您好。两种范式：①把CNC的数据集和自己若干人的数据集，合并在一起进行训练。CNC的作为陌生人。②只训练自己的数据集。两种范式，分别采用“新的人”数据作为陌生人进行测试。请问，作者有做过类似的工作没？哪种在陌生人上表现效果好？

Provide feedback