版权说明 操作指南
首页 > 成果 > 详情

i-TDNN:一种基于TDNN改进的含噪声纹识别方法

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
论文标题(英文):
i-TDNN:An improved noise speaker recognition method based on TDNN
作者:
伍雄;陈为真
作者机构:
武汉轻工大学电气与电子工程学院,湖北武汉430048
[陈为真; 伍雄] 武汉轻工大学
语种:
中文
关键词:
声纹识别;时延神经网络;自注意力机制;残差连接;多层特征聚合
关键词(英文):
Voiceprint Recognition;TDNN;Residual Connection;Self Attention;Multilayer Feature Aggregation
期刊:
长江信息通信
ISSN:
2096-9759
年:
2023
卷:
36
期:
2
页码:
27-30
基金类别:
湖北省教育厅科技项目(B2020061)。
机构署名:
本校为第一机构
院系归属:
电气与电子工程学院
摘要:
针对声纹识别任务在含噪背景下鲁棒性欠佳的问题,文章提出了一种基于TDNN改进的含噪声纹识别方法。该算法先提取说话人音频的梅尔频谱,利用自注意力机制(SE)使得网络更加聚焦于重要特征,引入残差连接(Res)修正梅尔频谱与输...展开更多 针对声纹识别任务在含噪背景下鲁棒性欠佳的问题,文章提出了一种基于TDNN改进的含噪声纹识别方法。该算法先提取说话人音频的梅尔频谱,利用自注意力机制(SE)使得网络更加聚焦于重要特征,引入残差连接(Res)修正梅尔频谱与输出层的特征损失信息,一定程度缓解神经网络退化的问题,使用多层特征聚合(MFA)密集连接输出特征,生成关注统计池的特征,最终生成一种强鲁棒性的...
摘要(英文):
To solve the problem that voice print recognition is not robust under background noise,this paper proposes an end-to-end Speaker Vector based on TDNN.Firstly,the algorithm extracts the Mahr spectrum of the speaker audio,and corrects the feature loss information of...MORE To solve the problem that voice print recognition is not robust under background noise,this paper proposes an end-to-end Speaker Vector based on TDNN.Firstly,the algorithm extracts the Mahr spectrum of the speaker audio,and corrects the feature loss information of the Mahr spectrum and the output layer with the residuals conne...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com