一种基于cedar双数组字典树算法进行术语匹配的方法

基本信息

申请号 CN201610897558.3 申请日 -
公开(公告)号 CN106528647B 公开(公告)日 2019-07-23
申请公布号 CN106528647B 申请公布日 2019-07-23
分类号 G06F16/31;G06F17/28 分类 计算;推算;计数;
发明人 冯泽康 申请(专利权)人 北京语联炉火信息技术有限公司
代理机构 北京康盛知识产权代理有限公司 代理人 传神语联网网络科技股份有限公司
地址 430073 湖北省武汉市东湖新技术开发区高新大道999号未来城龙山创新园一期B2栋(除101室以外)(自贸区武汉片区)
法律状态 -

摘要

摘要 一种基于cedar双数组字典树算法进行术语匹配的方法,其特征是包括包括建索引的步骤,及用索引进行术语查询匹配的步骤;其中,所述建索引的步骤是遍历数据库,获取术语集合,调用cedar双数组字典树插入术语,用以形成术语集合的索引;所述cedar双数组字典树包括一个以基准值和校验值为成员的结构体数组,一个与结构体数组体量相同的循环队列;将cedar双数组算法应用于术语匹配引擎的建索引和根据索引来查询术语,极大地提升了术语匹配引擎的效率,同时该算法也避免了经典的双数组算法libdatrie对大量术语建索引时速度非常慢而不利于快速重建数据的缺点;二叉树作为一种辅助结构,可以用来快速地还原整个双数组字典树。