一种关键词提取模型的训练方法及相关装置

基本信息

申请号 CN202111602825.7 申请日 -
公开(公告)号 CN114239555A 公开(公告)日 2022-03-25
申请公布号 CN114239555A 申请公布日 2022-03-25
分类号 G06F40/247(2020.01)I;G06F40/289(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 李电祥;陈学珉;毛骏 申请(专利权)人 上海畅圣计算机科技有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 王晓芬
地址 200433上海市杨浦区黄兴路2005弄2号(B楼)706-9室
法律状态 -

摘要

摘要 本申请公开了一种关键词提取模型的训练方法,包括:对原始数据进行纠错处理,得到已纠错数据;基于同义词词表对所述已纠错数据进行数据增强处理,得到第一输入数据;基于投影梯度下降方式对所述已纠错数据进行对抗学习处理,得到第二输入数据;采用基于attention与改进型Bi‑LSTM结构的关键词提取模型对所述第一输入数据和所述第二输入数据进行训练处理,得到已训练的所述关键词模型。采用attention与改进型Bi‑LSTM结构进行特征提取,可以有效地从数据中提取关键信息,提高关键词提取的性能和效果。本申请还公开了一种关键词提取模型的训练装置、服务器以及计算机可读存储介质,具有以上有益效果。