一种面向电力规划评审领域的命名实体识别方法
基本信息
申请号 | CN202111485849.9 | 申请日 | - |
公开(公告)号 | CN114154505A | 公开(公告)日 | 2022-03-08 |
申请公布号 | CN114154505A | 申请公布日 | 2022-03-08 |
分类号 | G06F40/295(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 罗劲瑭;姚实颖;冯渝荏;徐杰;杨宇玄;陈一鸣;曾鉴;祝和春;余葭苇;倪江;张晨琳 | 申请(专利权)人 | 国网四川省电力公司经济技术研究院 |
代理机构 | 成都行之专利代理事务所(普通合伙) | 代理人 | 张杨 |
地址 | 610000四川省成都市中国(四川)自由贸易试验区成都市高新区蜀绣西路366号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种面向电力规划评审领域的命名实体识别方法,包括S1:根据样本语料数据集特征,设立多个刻画实体不同性质的实体标签,获得分词后的样本语料;S2:将分词后的样本语料加载到Glove模型以训练词向量,按位置拼接后得到文本序列向量矩阵;S3:利用多尺度卷积网络对文本序列向量矩阵卷积后重组池化,提取出序列中词粒度的词汇信息;S4:将以文本序列向量矩阵为输入的BiLSTM网络中前向LSTM和后向LSTM末尾状态进行拼接,提取出序列中句粒度的词缀信息;S5:利用Cross‑Transformer模块对序列中词粒度的词汇信息和序列中句粒度的词缀信息进行融合,最后通过CRF层完成命名实体识别。本发明在一定程度上提高了电力规划评审领域命名实体识别的效率。 |
