一种基于多任务学习的嵌套实体识别系统

基本信息

申请号 CN202011292686.8 申请日 -
公开(公告)号 CN112347785A 公开(公告)日 2021-02-09
申请公布号 CN112347785A 申请公布日 2021-02-09
分类号 G06F40/295(2020.01)I; 分类 计算;推算;计数;
发明人 刘晨旭;范红杰;胡振宇;柳军飞 申请(专利权)人 湖南国发控股有限公司
代理机构 长沙市标致专利代理事务所(普通合伙) 代理人 蒋佳玉
地址 410011湖南省长沙市雨花区美林街35号盐船山生态园1栋2701房
法律状态 -

摘要

摘要 一种基于多任务学习的嵌套实体识别系统,本方法使用基于跨度的方法解决命名实体识别中命名实体出现嵌套的情况;利用BERT模型编码上下文信息解决跨度表示的问题;将命名实体识别分解为实体确定和实体分类两个任务,使用多任务学习的方法解决正负样本分布不均衡的问题;提出实体交并比损失函数解决困难样本的问题。本发明能有效解决嵌套命名实体问题,与当前未使用额外数据的同类方法对比,本发明在三个公开嵌套命名实体数据集GENIA、ACE2004、ACE2005上均取得了最好效果,并且在非嵌套命名实体问题上也能取得有竞争力的效果,可以作为命名实体通用方法使用。