地址标准化方法、系统及电子设备

基本信息

申请号 CN202011349668.9 申请日 -
公开(公告)号 CN112417812A 公开(公告)日 2021-02-26
申请公布号 CN112417812A 申请公布日 2021-02-26
分类号 G06F40/103(2020.01)I;G06F16/33(2019.01)I;G06F16/31(2019.01)I;G06F40/151(2020.01)I 分类 计算;推算;计数;
发明人 元方;张凡超 申请(专利权)人 新智认知数据服务有限公司
代理机构 上海远同律师事务所 代理人 许力;张坚
地址 201209上海市浦东新区川沙路955号11幢221室
法律状态 -

摘要

摘要 一种地址标准化方法、系统及电子设备,本发明将待标准化地址字符串转为拼音字符组,与纠错词集合匹配,得到相应的中文词集合,在关键词集合中查询中文词集合中的各中文词,形成关键中文词集合,中文词数量记为size_cn_keys,对关键中文词集合中的每个中文词进行召回操作,形成第一集合,统计第一集合中的每个标准地址字符串包含中文词集合中不重复中文词的数量size_in,将满足size_in/size_cn_keys≧阈值的相应标准地址字符串加入第二集合,若第二集合中size_in/size_cn_keys的最大值的标准地址字符串只有一条且该最大值为1时,则该标准地址字符串即为待标准化的地址字符串的标准地址,否则,通过相似度匹配,得到待标准化的地址字符串的标准地址。本发明可以准确并且快速地实现地址标准化。