一种基于统计分词的地址匹配方法

基本信息

申请号 CN201810833826.4 申请日 -
公开(公告)号 CN109145169B 公开(公告)日 2021-03-26
申请公布号 CN109145169B 申请公布日 2021-03-26
分类号 G06F40/284(2020.01)I;G06F16/29(2019.01)I;G06F16/9035(2019.01)I 分类 计算;推算;计数;
发明人 陈张建;李晶云;李爱勤;王延朝;祝士杰;赵飞;陆泽;丁宜忠 申请(专利权)人 北京吉威空间信息股份有限公司
代理机构 北京纽乐康知识产权代理事务所(普通合伙) 代理人 白明珠
地址 310000浙江省杭州市西湖区保俶北路83号
法律状态 -

摘要

摘要 本发明公开了一种基于统计分词的地址匹配方法,包括以下步骤:S1基于省/市/县/街区、乡、镇、/村、社区5级行政区划建立行政区划本底库;S2使用包括道路街巷地名、片区地名、自然村地名、小区地名、建筑物地名、其他自然地名在内的地名模型建立地名本底库;S3使用标准地址模型建立地址本底库;S4基于行政区划本地库、地名本地库和地址本地库构建地理编码索引库;S5利用分词技术和搜索引擎,建立地址匹配算法。有益效果:能够解决地址信息数据量大,现有地址匹配技术中对未登录词匹配成功率较低的问题;以及地址匹配规则复杂,现有匹配算法的检索速度和准确性不高,地址匹配效率较低的问题。