文本编码方法、装置、设备及计算机可读存储介质

基本信息

申请号 CN202110033100.4 申请日 -
公开(公告)号 CN112749530A 公开(公告)日 2021-05-04
申请公布号 CN112749530A 申请公布日 2021-05-04
分类号 G06F40/126;G06F16/35;G06F16/33;G06N3/04;G06N20/10 分类 计算;推算;计数;
发明人 陈文斌;王腾飞;魏帮国 申请(专利权)人 北京光速斑马数据科技有限公司
代理机构 北京天方智力知识产权代理事务所(普通合伙) 代理人 贾耀梅
地址 100027 北京市朝阳区东直门外西八间房万红西街2号21幢D座二层D2001
法律状态 -

摘要

摘要 本申请提供了一种文本编码方法,包括:将目标文本进行规则匹配,若匹配成功,则生成目标文本的第一编码结果;利用至少两个文本分类模型对目标文本进行分类,若至少两个文本分类模型对目标文本进行分类的分类结果相同、且各分类结果的置信度大于预设阈值,则将目标文本的模型编码结果作为第二编码结果;根据第一编码结果与第二编码结果,生成目标文本的最终编码结果。本申请基于自然语言处理技术的相关算法对目标文本进行处理,可以使最终编码结果的查准率和查全率大大提升。