版权说明 操作指南
首页 > 成果 > 详情

基于多模态融合和竞争力的视频场景分割算法

认领
导出
Link by 中国知网学术期刊 Link by 维普学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
杨亭;丰洪才;金凯;赵杰雪
作者机构:
武汉轻工大学 数学与计算机学院,湖北 武汉,430023
[赵杰雪; 金凯; 杨亭; 丰洪才] 武汉轻工大学
语种:
中文
关键词:
竞争力;多模态融合;相似性度量;典型相关性;场景分割
关键词(英文):
competition;multi-modality;similarity measurement;canonical correlation;scene segmentation
期刊:
武汉理工大学学报(信息与管理工程版)
ISSN:
2095-3852
年:
2014
期:
6
页码:
759-763
基金类别:
2009Chb008:湖北省自然科学基金 2010CDB06603:湖北省自然科学基金 D20101703:湖北省教育厅科学研究重点项目
机构署名:
本校为第一机构
院系归属:
数学与计算机学院
摘要:
针对视频分割中底层特征与高层语义之间的“语义鸿沟”问题,提出了一种基于多模态融合和镜头间竞争力的场景分割算法,对视频帧的图像、文本、音频等模态进行特征提取,用欧式距离、余弦距离计算出同种模态数据的相似性,用典型相关分析法计算出不同模态数据的相关度,分别对各模态数据的相似性和相关度进行融合得到镜头之间的相似度和相关度,采用镜头间竞争力的方法分别对相似镜头和相关镜头进行场景分割并对分割出的两个场景边界集合取交集得到最终的场景边界,从而实现对视频的场景分割。实验结果表明,该方法在场景分割中具有较高的性能,查全率和查准率分别达到82.1%和86.7%。
摘要(英文):
To solve the problem of"semantic gap"between low-level features and high-level semantic in video scene seg-mentation, an algorithm of video scene segmentation was put forward based on multimodal feature fusion and competition.The im-age, text and audio features were abstracted as the low-level features of the video frame.Euclidean distance, cosine similarity distance were used to calculate the similarity of homogeneous data, and the method of canonical correlation analysis was used to calculate the heterogeneous data correlation, re...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com