一种基于深度神经网络的智能视觉问答模型

基本信息

申请号 CN201711494024.7 申请日 -
公开(公告)号 CN108170816A 公开(公告)日 2020-12-08
申请公布号 CN108170816A 申请公布日 2020-12-08
分类号 G06F17/30;G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 纪荣嵘;周奕毅 申请(专利权)人 厦门大学资产经营有限公司
代理机构 厦门南强之路专利事务所(普通合伙) 代理人 马应森
地址 361005 福建省厦门市思明南路422号
法律状态 -

摘要

摘要 一种基于深度神经网络的智能视觉问答模型,涉及人工智能领域中的智能视觉问答。包括以下步骤:智能问答数据预处理;图像深度卷积特征抽取;文本问题深度特征抽取;智能视觉问题处理;基于枢纽通道的视觉智能问答。采用多任务学习框架进行全新的深度学习网络设计以解决智能视觉问答中训练数据缺乏与回答原因不可知等两大问题。设计了一新型的深度学习网络结构,该网络在进行智能视觉问答的同时能够对给出的答案进行原因说明,该网络结构包含一视觉描述模块,可根据问题内容针对性地对图像内容进行描述。该网络结构采用了枢纽结构设计,能将图像描述、文本问答等领域的数据引入到视觉智能问答任务中来。