基于关键字的字符序列分割方法及装置
基本信息
申请号 | CN201110265973.4 | 申请日 | - |
公开(公告)号 | CN102819524A | 公开(公告)日 | 2012-12-12 |
申请公布号 | CN102819524A | 申请公布日 | 2012-12-12 |
分类号 | G06F17/27(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 阳荣 | 申请(专利权)人 | 北京金蝶云基科技有限公司 |
代理机构 | 深圳市世纪恒程知识产权代理事务所 | 代理人 | 胡海国 |
地址 | 102400 北京市房山区良乡凯旋大街建设路18号-C1065 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种基于关键字的字符序列分割方法及装置,其方法包括:加载关键字,并建立关键字列表;根据关键字列表中关键字属性的优先级对关键字进行排序;依据排序结果,以关键字为最小分割单位,通过预定的分词算法对字符序列进行分割。本发明通过定义关键字的优先级,建立关键字列表,以关键字列表中各关键字的优先级排列顺序,同时以关键字为最小分割单位,按照预定的分词算法对字符序列进行分割,提高了分词准确率及新词识别能力,避免了分词歧义,可以满足公式、函数校验、解析等对分词要求严格的应用场景。 |
