基于BiLSTM和注意力机制的图文多模态情感识别方法

基本信息

申请号 CN202111021378.6 申请日 -
公开(公告)号 CN113705703A 公开(公告)日 2021-11-26
申请公布号 CN113705703A 申请公布日 2021-11-26
分类号 G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 金勇;胡林利;陈宏明 申请(专利权)人 武汉长江通信产业集团股份有限公司
代理机构 上海精晟知识产权代理有限公司 代理人 刘点
地址 430000湖北省武汉市东湖开发区关东工业园文华路2号
法律状态 -

摘要

摘要 本发明公开了基于BiLSTM和注意力机制的图文多模态情感识别方法,包括如下步骤:采集文本数据和图片数据;向量预处理,文本和图片先单独进行向量表达;文本向量和图片向量各自均经过注意力机制attention和GRU模型的结合训练;文本和图片的向量联合起来通过softmax函数进行最终综合结果的识别。本发明采用WORD2VEC和CNN技术分别对文本和图片进行预处理得到初步向量表达,然后采用BiLSTM、GRU和注意力机制进行交叉训练,再将结果融合到softmax层进行最终监督式标签识别。实验针对19000条以上的数据(每条数据包含文本和图片)进行模型训练分析,结果证明融合了图片和文字的机器学习效果更好。