基于深度网络的多模态视频场景分割算法

首页 > 成果 > 详情

认领

导出

Link by 中国知网学术期刊 Link by 万方学术期刊

反馈

作者信息关键词期刊信息基础信息归属信息摘要

成果类型：

期刊论文

作者：

苏筱涵;丰洪才;吴诗尧

作者机构：

武汉轻工大学数学与计算机学院,湖北武汉430023

武汉轻工大学网络与信息中心,湖北武汉430023

[苏筱涵; 吴诗尧; 丰洪才] 武汉轻工大学

语种：

中文

关键词：

场景分割;多模态;深度网络嵌入;时间约束聚类;语义特征

期刊：

武汉理工大学学报(信息与管理工程版)

ISSN：

2095-3852

年：

2020

卷：

期：

页码：

246-251,259

DOI：

10.3963/j.issn.2095-3852.2020.03.010

基金类别：

湖北省教育厅重点科研计划（D20101703）；

机构署名：

本校为第一机构

院系归属：

数学与计算机学院

摘要：

针对视频场景中底层特征与高层语义特征之间存在的“语义鸿沟”及多特征融合等问题,根据视频多模态之间时序关联共生的特性,提出了一种基于深度网络的多模态视频场景分割算法,从每个镜头中提取丰富的底层特征及语义概念特征,将其特征向量串联的整体特征向量作为深度网络的输入并进行嵌入空间学习,通过计算两个镜头整体特征向量之间的距离得到语义相似性的度量值,然后最小化时间段内距离的平方和对镜头进行聚类处理,最终得到语义层面的场景.实验结果表明,该算法在分类精度上具有良好的性能,能对视频场景实现有效分割.

反馈

产权有误：本人成果被他人认领

数据有误：数据基本信息有误

归属有误：成果的院系归属、机构署名归属有误

其他原因：

验证码：

看不清楚，换一个

确定

取消

成果认领

标题：

用户	作者	通讯作者	--
	请选择	请选择	--

确定

取消

基于深度网络的多模态视频场景分割算法

反馈

成果认领

提示

该栏目需要登录且有访问权限才可以访问