一种图像字幕生成的方法及系统
基本信息
申请号 | CN201910885349.0 | 申请日 | - |
公开(公告)号 | CN110750669A | 公开(公告)日 | 2020-02-04 |
申请公布号 | CN110750669A | 申请公布日 | 2020-02-04 |
分类号 | G06F16/58;G06F16/55;G06N3/08;G06N3/04 | 分类 | 计算;推算;计数; |
发明人 | 杨志明 | 申请(专利权)人 | 深思考人工智能机器人科技(北京)有限公司 |
代理机构 | 北京德琦知识产权代理有限公司 | 代理人 | 深思考人工智能机器人科技(北京)有限公司 |
地址 | 100084 北京市海淀区上地信息路12号中关村发展大厦B区B203 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种图像字幕生成的方法及系统,本发明实施例中的神经网络模型采用编码器‑解码器(encoder‑decoder)递归双向循环神经网络架构,该模型包括两个主要部分:图像特征提取部分和图像字幕生成部分。其中,对于图像特征提取部分,设置卷积神经网络将图像转换为图像的特征矢量信息;对于图像字幕生成部分,设置双向循环神经网络,输入图像的特征矢量信息,双向循环神经网络提取到文本中的深度语义信息,最终得到图像字幕信息。本发明实施例简单地自动生成图像字幕,且提高图像字幕生成的准确率。 |
