一种基于cedar双数组字典树算法进行术语匹配的方法
基本信息
申请号 | CN201610897558.3 | 申请日 | - |
公开(公告)号 | CN106528647A | 公开(公告)日 | 2017-03-22 |
申请公布号 | CN106528647A | 申请公布日 | 2017-03-22 |
分类号 | G06F17/30(2006.01)I;G06F17/28(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 冯泽康 | 申请(专利权)人 | 北京语联炉火信息技术有限公司 |
代理机构 | 北京康盛知识产权代理有限公司 | 代理人 | 北京语联炉火信息技术有限公司;传神语联网网络科技股份有限公司 |
地址 | 100086 北京市海淀区知春路51号1幢4层407室 | ||
法律状态 | - |
摘要
摘要 | 一种基于cedar双数组字典树算法进行术语匹配的方法,其特征是包括建索引的步骤,及用索引进行术语查询匹配的步骤;其中,所述建索引的步骤是遍历数据库,获取术语集合,调用cedar双数组字典树插入术语,用以形成术语集合的索引;所述cedar双数组字典树包括一个以基准值和校验值为成员的结构体数组,一个与结构体数组体量相同的循环队列;将cedar双数组算法应用于术语匹配引擎的建索引和根据索引来查询术语,极大地提升了术语匹配引擎的效率,同时该算法也避免了经典的双数组算法libdatrie对大量术语建索引时速度非常慢而不利于快速重建数据的缺点;二叉树作为一种辅助结构,可以用来快速地还原整个双数组字典树。 |
