一种基于图片问答的处理方法
基本信息
申请号 | CN202210321278.3 | 申请日 | - |
公开(公告)号 | CN114416914B | 公开(公告)日 | 2022-07-08 |
申请公布号 | CN114416914B | 申请公布日 | 2022-07-08 |
分类号 | G06F16/31(2019.01)I;G06F16/332(2019.01)I;G06F16/33(2019.01)I;G06F40/279(2020.01)I;G06Q30/06(2012.01)I;G06V30/40(2022.01)I;G06N3/08(2006.01)I;CN 111930887 A,2020.11.13;CN 110647629 A,2020.01.03;US 2020090539 A1,2020.03.19;CN 112800191 A,2021.05.14;CN 107609056 A,2018.01.19;CN 113761153 A,2021.12.07;CN 114155530 A,2022.03.08;CN 113360699 A,2021.09.07;CN 113886626 A,2022.01.04;CN 113656570 A,2021.11.16;CN 113407663 A,2021.09.17 郑伟曼.“基于图像场景图的视觉问答方法的研究”.《中国优秀硕士学位论文全文数据库 信息科技辑》.2022,;李根.“基于预训练的跨模态统一模型研究”.《中国优秀硕士学位论文全文数据库 信息科技辑》.2020,;李庆.“基于深度神经网络和注意力机制的图像问答研究”.《中国优秀硕士学位论文全文数据库 信息科技辑》.2019,;Linjie Li 等.“Relation-Aware Graph Attention Network for Visual Question Answering”.《2019 IEEE/CVF International Conference on Computer Vision (ICCV)》.2020, | 分类 | 计算;推算;计数; |
发明人 | 谷满昌;张镜;马洋 | 申请(专利权)人 | 中建电子商务有限责任公司 |
代理机构 | 成都春夏知识产权代理事务所(特殊普通合伙) | 代理人 | - |
地址 | 610000四川省成都市青羊区腾飞大道51号18栋12层1202号 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及图片问答处理技术领域,公开了一种基于图片问答的处理方法,该方法包括:对商品详情页进行OCR光学识别,获取第一段落;将第一段落和用户问题分为有序的单词序列,通过信息检索获取最相关的K个第二段落;将用户问题和K个第二段落分别进行分词;将用户问题分别和每个第二段落进行拼接,并在用户问题前加入标记位得到第三段落,对第三段落进行建模,构造多个输入向量;用相加后的输入向量表示第三段落,输入到中文预训练模型,将中文预训练模型的最终隐藏状态转化为答案跨度概率值。本申请的技术方案提高图片问答用户体验,同时也节约了商家的配置答案的成本,提升了图片问答效率。 |
