专利文本中的领域命名实体识别方法、装置、介质及设备

基本信息

申请号 CN202210081976.0 申请日 -
公开(公告)号 CN114444470A 公开(公告)日 2022-05-06
申请公布号 CN114444470A 申请公布日 2022-05-06
分类号 G06F40/211(2020.01)I;G06F40/295(2020.01)I;G06K9/62(2022.01)I 分类 计算;推算;计数;
发明人 严妍;彭祖剑;汪敏;裴非;石鑫;白杨 申请(专利权)人 北京开普云信息科技有限公司
代理机构 北京德崇智捷知识产权代理有限公司 代理人 邢飞飞
地址 523000广东省东莞市石龙镇中山东东升路1号汇星商业中心5栋2单元1805室
法律状态 -

摘要

摘要 本申请公开了一种专利文本中的领域命名实体识别方法、装置、介质及设备,属于计算机技术领域。所述方法包括:获取训练数据,训练数据中包含多篇专利文本的至少一个字段和已经标注好的领域命名实体;利用训练数据对BART预训练模型进行训练;根据预设的Prompt模板和训练数据生成Prompt数据,其中,Prompt模板是针对同一专利领域中领域命名实体的特点创建的,且不同专利领域的Prompt模板不同;利用Prompt数据对训练后的BART模型进行调优,得到领域命名实体识别模型;利用领域命名实体识别模型识别各个专利文本中的领域命名实体。本申请既降低了专利文本中的领域命名实体的识别难度,也提高了识别的准确率。