文本识别模型训练方法、文本识别方法、装置以及介质

基本信息

申请号 CN202110785051.X 申请日 -
公开(公告)号 CN113486178A 公开(公告)日 2021-10-08
申请公布号 CN113486178A 申请公布日 2021-10-08
分类号 G06F16/35(2019.01)I;G06F40/289(2020.01)I;G06F40/295(2020.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 邓乔波;周小明;潘申龄;李林翰;黄之;吴金鑫;侯立冬;孟宝权;王杰;杨满智;蔡琳;梁彧;田野;傅强;金红;陈晓光 申请(专利权)人 恒安嘉新(北京)科技股份公司
代理机构 北京品源专利代理有限公司 代理人 李礼
地址 100098北京市海淀区北三环西路25号27号楼五层5002室
法律状态 -

摘要

摘要 本发明实施例公开了一种文本识别模型训练方法、文本识别方法、装置以及介质。所述文本识别模型训练方法,包括:获取待处理短文本训练数据;根据待处理短文本训练数据生成文本向量序列;对文本向量序列进行序列特征提取处理,得到序列特征提取结果,并将序列特征提取结果确定为短文本分类结果;短文本分类结果包括第一短文本分类标签和第一标签概率;对序列特征提取结果进行实体特征提取处理,得到实体特征提取结果;根据序列特征提取结果和实体特征提取结果对文本识别模型进行训练。本发明实施例的技术方案能够利用对短文本提取的多维特征完成短文本分类以及实体识别,从而提高文本识别模型的精准度。