一种基于注意力机制和模态依赖的跨媒体交叉检索方法

基本信息

申请号 CN202111334294.8 申请日 -
公开(公告)号 CN113792167A 公开(公告)日 2021-12-14
申请公布号 CN113792167A 申请公布日 2021-12-14
分类号 G06F16/483(2019.01)I;G06F16/432(2019.01)I;G06F16/35(2019.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06T5/00(2006.01)I 分类 计算;推算;计数;
发明人 姚亚洲;孙泽人;陈涛;张传一;沈复民 申请(专利权)人 南京码极客科技有限公司
代理机构 成都君合集专利代理事务所(普通合伙) 代理人 尹新路
地址 211899江苏省南京市浦口区新北路1号江北国际智谷B栋5层
法律状态 -

摘要

摘要 本发明涉及跨媒体检索技术技术领域,公开了一种基于注意力机制和模态依赖的跨媒体交叉检索方法,包括以下步骤:步骤S1.根据提取器获取媒体类型数据,媒体类型数据包括文本数据、图像数据、音频数据和视频数据;步骤S2.基于文本卷积网络、图像卷积网络、三元组损失函数、判别损失函数和分类损失函数对文本数据和图像数据创建图像文本网络;步骤S3.基于注意力机制、交叉熵损失函数、中心损失函数、四元组损失函数和分布损失函数对图像数据、音频数据和视频数据创建图像音频网络;步骤S4.对图像文本网络和图像音频网络训练后进行跨媒体交叉检索。本发明通过注意力机制与模态依赖进行细粒度跨媒体检索。