声纹识别开源工具ASV-Subtools

厦门大学智能语音实验室

2020.11

纲 要

1. 背景介绍

2. 开源工具ASV -Subtools

3. 算法改进

4. 实验结果

5. 总结与展望

1. 背景介绍—声纹识别框架

FBank MFCC PLP

注册语音 声学特征 说话人表征 分

声纹模型 后端判别

测试语音 声学特征 说话人表征 数

GMM/i-vector NNET/x-vector

声纹识别框架图

1. 背景介绍—声纹识别技术

Softmax

损失 A -Softmax

AM-Softmax

函数 AAM-Softmax

……

TDNN

E-TDNN

F-TDNN

Resnet

加噪 CNN, SincNet

模拟远场

Specaug 数据 声纹识别 模型 Attention Pooling

Online扩增 LDE Pooling

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐