一种图像字幕生成的方法及系统

基本信息

申请号 CN201910885349.0 申请日 -
公开(公告)号 CN110750669A 公开(公告)日 2020-02-04
申请公布号 CN110750669A 申请公布日 2020-02-04
分类号 G06F16/58;G06F16/55;G06N3/08;G06N3/04 分类 计算;推算;计数;
发明人 杨志明 申请(专利权)人 深思考人工智能机器人科技(北京)有限公司
代理机构 北京德琦知识产权代理有限公司 代理人 深思考人工智能机器人科技(北京)有限公司
地址 100084 北京市海淀区上地信息路12号中关村发展大厦B区B203
法律状态 -

摘要

摘要 本发明公开了一种图像字幕生成的方法及系统,本发明实施例中的神经网络模型采用编码器‑解码器(encoder‑decoder)递归双向循环神经网络架构,该模型包括两个主要部分:图像特征提取部分和图像字幕生成部分。其中,对于图像特征提取部分,设置卷积神经网络将图像转换为图像的特征矢量信息;对于图像字幕生成部分,设置双向循环神经网络,输入图像的特征矢量信息,双向循环神经网络提取到文本中的深度语义信息,最终得到图像字幕信息。本发明实施例简单地自动生成图像字幕,且提高图像字幕生成的准确率。