文本编码方法、装置、设备及计算机可读存储介质
基本信息
申请号 | CN202110033100.4 | 申请日 | - |
公开(公告)号 | CN112749530A | 公开(公告)日 | 2021-05-04 |
申请公布号 | CN112749530A | 申请公布日 | 2021-05-04 |
分类号 | G06F40/126;G06F16/35;G06F16/33;G06N3/04;G06N20/10 | 分类 | 计算;推算;计数; |
发明人 | 陈文斌;王腾飞;魏帮国 | 申请(专利权)人 | 北京光速斑马数据科技有限公司 |
代理机构 | 北京天方智力知识产权代理事务所(普通合伙) | 代理人 | 贾耀梅 |
地址 | 100027 北京市朝阳区东直门外西八间房万红西街2号21幢D座二层D2001 | ||
法律状态 | - |
摘要
摘要 | 本申请提供了一种文本编码方法,包括:将目标文本进行规则匹配,若匹配成功,则生成目标文本的第一编码结果;利用至少两个文本分类模型对目标文本进行分类,若至少两个文本分类模型对目标文本进行分类的分类结果相同、且各分类结果的置信度大于预设阈值,则将目标文本的模型编码结果作为第二编码结果;根据第一编码结果与第二编码结果,生成目标文本的最终编码结果。本申请基于自然语言处理技术的相关算法对目标文本进行处理,可以使最终编码结果的查准率和查全率大大提升。 |
