一种用于命名实体识别的方法与装置

基本信息

申请号 CN202010054650.X 申请日 -
公开(公告)号 CN111291565A 公开(公告)日 2020-06-16
申请公布号 CN111291565A 申请公布日 2020-06-16
分类号 G06F40/295(2020.01)I 分类 -
发明人 宋彦;田元贺;王咏刚 申请(专利权)人 创新工场(广州)人工智能研究有限公司
代理机构 北京启坤知识产权代理有限公司 代理人 赵晶
地址 510700广东省广州市黄埔区光谱中路23号A2栋1001房
法律状态 -

摘要

摘要 本发明的目的是提供一种命名实体识别方法与装置。根据输入词序列,获取其中每个词的上下文特征及其对应的句法知识;针对所述每个词,将其每个上下文特征以及相应的句法知识分别映射为一个键向量和一个相应的值向量;确定所述每个词的所有值向量的加权和向量;对所述输入词序列中每个词的所述词向量与所述加权和向量串联后的向量进行命名实体预测,以获得相应的识别结果,所述识别结果指示所述每个词的命名实体标签。与现有技术相比,本发明把加权的句法知识引入到通常的基于序列标注的深度学习命名实体识别系统中。因此,本发明能够在深度学习的框架中有效利用上下文特征来为其所对应的句法知识加权,进而提升命名实体识别系统的性能。