版权说明 操作指南
首页 > 成果 > 详情

基于信息熵和时间趋势的音频关注区域提取算法研究

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
论文标题(英文):
Audio region of interest extraction algorithm based on information entropy and time trend
作者:
刘宇;张聪;杭波;王松;赵涵捷;...
作者机构:
武汉轻工大学数学与计算机学院,武汉430023
湖北文理学院计算机工程学院,湖北襄阳441053
语种:
中文
关键词:
音频;关注区域;关注度计算;信息熵;时间趋势
关键词(英文):
area of interest;attention computational model;entropy of information;time trend
期刊:
计算机应用研究
ISSN:
1001-3695
年:
2019
卷:
36
期:
12
页码:
3652-3656
基金类别:
国家自然科学基金面上项目(61272278) 湖北省重大科技专项资助项目(2018ABA099) 湖北省自然科学基金青年项目(2018CFB408) 湖北省教育厅科学技术研究项目(Q20181807)。
机构署名:
本校为第一机构
院系归属:
数学与计算机学院
摘要:
音频信号某区域的关注情况受音频特征的影响,目前主要自下而上的关注区域提取算法大多将一维音频信号转至二维图像利用图像显著性算法进行分析,往往忽略了关注事件在时间维度上的持续性特征。针对此问题,基于音频信号的信息熵特征同时引入统计学时间趋势相关算法,通过对信号分帧求取信息熵值,再进行指数移动平均等计算得到关注度值,从而确定高关注区域。与当前的主流关注度提取算法进行对比,在很好检测到关注区域的起止点基础上,计算得到的关注度值整体更平滑,同时考虑了人耳听觉系统对某事件关注的持续性特点,通过对一段脱口秀节目音频进行实验,得到整体掌声笑声片段检出率为81. 6%。
摘要(英文):
Many sound characteristics can affect the attention of the human auditory system to a certain audio signal. The main bottom-up algorithm uses the saliency algorithm of image to calculate the audio attention value by converting the one-dimensional audio signal into a two-dimensional image,and it usually ignores the persistence characteristics of the attention event in the time dimension. To solve this problem,this paper proposed an algorithm based the information entropy value of the audio signal and the time trend algorithm to determine the region of the high-interest audio signal. Compared wi...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com