一种基于平格增强线性转换器的命名实体识别方法和系统

基本信息

申请号 CN202110408126.2 申请日 -
公开(公告)号 CN112989834B 公开(公告)日 2021-08-20
申请公布号 CN112989834B 申请公布日 2021-08-20
分类号 G06F40/295(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 陈哲乾;李一夫;马一凡 申请(专利权)人 杭州一知智能科技有限公司
代理机构 杭州求是专利事务所有限公司 代理人 郑海峰
地址 311200浙江省杭州市萧山区启迪路198号杭州湾信息港F座7楼
法律状态 -

摘要

摘要 本发明公开了一种基于平格增强线性转换器的命名实体识别方法和系统,属于自然语言处理命名实体识别领域。首先获取文本序列样本并标注实体的标签类别,将文本序列转换为平格结构;之后识别模型,通过最小化负对数似然损失函数对命名实体识别模型进行训练;在命名实体识别过程中,针对待识别的文本序列,经文本预处理后作为训练好的命名实体识别模型的输入,根据最大化预测得分获得识别结果。本发明基于更加高效的平格结构引入词汇信息进行词汇增强,为模型提供先验知识和实体的词汇边界信息,提高了模型对实体边界和实体类型的识别准确率。使用线性转换器对上下文信息进行建模,降低了模型复杂度,显著提高了模型运算效率,具有更高的实用价值。