基于卷积神经网络的多模态视频场景分割优化算法

首页 > 成果 > 详情

认领

导出

Link by 中国知网学术期刊 Link by 万方学术期刊

反馈

作者信息关键词期刊信息基础信息归属信息摘要

成果类型：

期刊论文

作者：

黄清;丰洪才;刘立

作者机构：

武汉轻工大学数学与计算机学院,武汉430023

[丰洪才] 武汉轻工大学网络与信息中心,武汉430023

[黄清; 刘立] 武汉轻工大学

语种：

中文

关键词：

场景分割;多模态;卷积神经网络;相似度度量

关键词(英文)：

VGG19

期刊：

计算机应用研究

ISSN：

1001-3695

年：

2022

卷：

期：

页码：

1595-1600

DOI：

10.19734/j.issn.1001-3695.2021.10.0404

基金类别：

湖北省教育厅重点科研计划（D20101703）；

机构署名：

本校为第一机构

院系归属：

数学与计算机学院

摘要：

针对基于内容的视频检索中场景分割效率有待提高的问题，该文提出了一种基于卷积神经网络提取特征的多模态视频场景分割优化算法。首先利用改进的VGG19网络从视频镜头中提取多种模态的底层特征和语义特征，再将这些特征组成向量，然后通过三重损失学习与镜头相似度计算等方法，使场景分割问题转换为对镜头边界的二分类问题，最后建立评分机制优化所得结果，获取分割好的视频场景及对应的场景边界，完成场景分割任务。实验结果表明，该算法能对视频场景进行有效分割，整体查全率与查准率分别能达到85.77%、87.01%。

摘要(英文)：

Aiming at the problem that the efficiency of scene segmentation in content-based video retrieval needs to be improved,this paper proposed a multi-modal video scene segmentation optimization algorithm based on feature extraction of convolutional neural network.Firstly,the algorithm applied the improved VGG19 network to extract underlying features and semantic features from each video shots.Secondly,this paper combined these features into vectors and applied the method of triplet loss learning and shot similarity calculation,so that converted the scene segmentation task to a binary classificatio...

反馈

产权有误：本人成果被他人认领

数据有误：数据基本信息有误

归属有误：成果的院系归属、机构署名归属有误

其他原因：

验证码：

看不清楚，换一个

确定

取消

成果认领

标题：

用户	作者	通讯作者	--
	请选择	请选择	--

确定

取消

基于卷积神经网络的多模态视频场景分割优化算法

反馈

成果认领

提示

该栏目需要登录且有访问权限才可以访问