一种基于多头自注意力机制的动态元嵌入方法

基本信息

申请号 CN202010367701.4 申请日 -
公开(公告)号 CN111581351A 公开(公告)日 2020-08-25
申请公布号 CN111581351A 申请公布日 2020-08-25
分类号 G06F16/33(2019.01)I 分类 -
发明人 王春辉;胡勇 申请(专利权)人 识因智能科技(北京)有限公司
代理机构 北京中北知识产权代理有限公司 代理人 识因智能科技(北京)有限公司
地址 102600北京市大兴区宏福路8号1层133室
法律状态 -

摘要

摘要 本发明公开一种基于多头自注意力机制的动态元嵌入方法。所述方法包括:将输入句子中的每个词表示为词向量序列,将每个词向量映射到同一维度,基于多头自注意力机制计算嵌入矩阵,得到元嵌入表示的词向量矩阵。本发明利用多头自注意力机制进行多次计算,解决了现有DME、CDME动态元嵌入方法使用句子级别的自注意力确定不同嵌入集的权重,其中自注意力方法着重于学习各个词向量线性回归的参数,缺乏多角度的综合考虑,容易造成元嵌入权重的学习不充分的问题。