一种中文分词方法、装置以及搜索词库读取方法

基本信息

申请号 CN202110434688.4 申请日 -
公开(公告)号 CN113111651A 公开(公告)日 2021-07-13
申请公布号 CN113111651A 申请公布日 2021-07-13
分类号 G06F40/284;G06F16/33;G06F16/338 分类 计算;推算;计数;
发明人 叶群莉;魏文华;李彩秀;刘宁;农翠华 申请(专利权)人 深圳市华南城数字科技有限公司
代理机构 深圳智趣知识产权代理事务所(普通合伙) 代理人 李兴生
地址 518000 广东省深圳市龙岗区平湖街道禾花社区华南大道一号华南城总部大楼801
法律状态 -

摘要

摘要 为了克服现有技术的不足,本发明提供了一种中文分词方法、装置以及搜索词库读取方法,包括:根据输入的最大词长,对待分词语句进行分词,得到第一次分词结果;将最大词长的长度逐渐减少,并且在每一次最大词长发生变化时,都对所述待分词语句进行分词,得到第N次分词结果;将第一次分词结果直至第N次分词结果分别与词库比较,得到输出列表。本发明能够准确的对待分词语句进行分词,尤其能够提升位于待分词语句中间的固定词语的识别率。本发明所述的方法具有分词效率高,分词结果准确的优点。