基于文本相似度计算的地址库数据处理方法和控制系统
基本信息
申请号 | CN202111184456.4 | 申请日 | - |
公开(公告)号 | CN113836357A | 公开(公告)日 | 2021-12-24 |
申请公布号 | CN113836357A | 申请公布日 | 2021-12-24 |
分类号 | G06F16/84(2019.01)I;G06F16/31(2019.01)I;G06F16/25(2019.01)I;G06K9/62(2006.01)I;G06Q30/06(2012.01)I | 分类 | 计算;推算;计数; |
发明人 | 王晓林 | 申请(专利权)人 | 北京商越网络科技有限公司 |
代理机构 | 北京市鼎立东审知识产权代理有限公司 | 代理人 | 陈佳妹;朱慧娟 |
地址 | 100000北京市海淀区农大南路1号院8号楼4层401-1001 | ||
法律状态 | - |
摘要
摘要 | 本申请涉及一种基于文本相似度计算的地址库数据处理方法和控制系统,通过获取第一地址库数据和第二地址库数据,并根据所述第一地址库数据建立按照地址层级排序的映射数据表;根据所述映射数据表,从所述映射数据表获取所有与所述第二地址库数据中的源地址同级的映射地址,并将所有映射地址的集合作为地址映射集;将所述第二地址库数中的源地址与所述地址映射集中的每一个地址进行相似度计算;根据相似度计算结果排序,将相似度最大值的地址作为所述源地址的目标地址。通过相似度计算,从映射地址表中获取不同地址层级的地址信息数据,将地址进行一层转换,精装且快速的匹配两个地址库,使得转换后的地址可直接应用于电商平台,加快电商交流。 |
