版权说明 操作指南
首页 > 成果 > 详情

基于深度网络的多模态视频场景分割算法

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
苏筱涵;丰洪才;吴诗尧
作者机构:
武汉轻工大学数学与计算机学院,湖北武汉430023
武汉轻工大学网络与信息中心,湖北武汉430023
[苏筱涵; 吴诗尧; 丰洪才] 武汉轻工大学
语种:
中文
关键词:
场景分割;多模态;深度网络嵌入;时间约束聚类;语义特征
期刊:
武汉理工大学学报(信息与管理工程版)
ISSN:
2095-3852
年:
2020
卷:
42
期:
03
页码:
246-251,259
基金类别:
湖北省教育厅重点科研计划(D20101703);
机构署名:
本校为第一机构
院系归属:
数学与计算机学院
摘要:
针对视频场景中底层特征与高层语义特征之间存在的“语义鸿沟”及多特征融合等问题,根据视频多模态之间时序关联共生的特性,提出了一种基于深度网络的多模态视频场景分割算法,从每个镜头中提取丰富的底层特征及语义概念特征,将其特征向量串联的整体特征向量作为深度网络的输入并进行嵌入空间学习,通过计算两个镜头整体特征向量之间的距离得到语义相似性的度量值,然后最小化时间段内距离的平方和对镜头进行聚类处理,最终得到语义层面的场景.实验结果表明,该算法在分类精度上具有良好的性能,能对视频场景实现有效分割.

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com