地址归一化处理方法及装置

基本信息

申请号 CN202011397609.9 申请日 -
公开(公告)号 CN112487122A 公开(公告)日 2021-03-12
申请公布号 CN112487122A 申请公布日 2021-03-12
分类号 G06F16/29(2019.01)I;G06F16/21(2019.01)I 分类 计算;推算;计数;
发明人 王乐斐;梁相军 申请(专利权)人 电信科学技术第十研究所有限公司
代理机构 广州三环专利商标代理有限公司 代理人 郭永丽
地址 710061陕西省西安市雁塔西路6号
法律状态 -

摘要

摘要 本发明一种地址归一化处理方法及装置,该方法包括:获取多种地址数据源,地址数据源包括多个与目标地址对应的原始地址;对各地址数据源中每个原始地址进行初步治理,得到初步治理后的原始地址;对各初步治理后的原始地址进行网络爬取,得到与初步治理后的原始地址对应的网爬经纬度;根据网爬经纬度,对各初步治理后的原始地址进行深度治理,得到归一化后的标准地名地址库。本发明基于多数据源经纬度精确匹配并使用地址权重归一化的方式来统一地址信息,有效解决了现有技术中对地址进行归一化分析的方法存在的处理效率低且准确性不高的问题,提升应用系统对地址信息的使用能力。