参考多模态信息的文本摘要生成方法、电子设备及介质
基本信息
申请号 | CN202210104367.2 | 申请日 | - |
公开(公告)号 | CN114491006A | 公开(公告)日 | 2022-05-13 |
申请公布号 | CN114491006A | 申请公布日 | 2022-05-13 |
分类号 | G06F16/34(2019.01)I;G06F16/35(2019.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06V30/40(2022.01)I;G06V10/80(2022.01)I;G06V10/82(2022.01)I | 分类 | 计算;推算;计数; |
发明人 | 张梓键;付卫婷 | 申请(专利权)人 | 浙江同善人工智能技术有限公司 |
代理机构 | 上海科盛知识产权代理有限公司 | 代理人 | - |
地址 | 314113浙江省嘉兴市嘉善县大云镇创业路555号E1幢 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种参考多模态信息的文本摘要生成方法、电子设备及介质,包括编码步骤和解码步骤;编码步骤包括:通过特征映射获取多模态信息的序列化特征,多模态信息包括文本信息、音频信息和图像信息;通过注意力机制对多模态信息的序列化特征进行增强,获得多模态信息的增强特征;对多模态信息的增强特征进行分类,获得若干类增强特征集合;将若干类增强特征集合一一对应输入若干个前馈神经网络中,对应获得若干组融合特征;将若干组融合特征拼接成特征融合向量;解码步骤包括:通过跨注意力机制,以特征融合向量作为隐状态输入,对文本信息的增强特征与特征融合向量进行特征融合,生成文本摘要。与现有技术相比,本发明具有效率高、准确性高等优点。 |
