基于商圈划分的企业线下与线上多源数据整合方法及装置

基本信息

申请号 CN202110287069.7 申请日 -
公开(公告)号 CN112783963A 公开(公告)日 2021-05-11
申请公布号 CN112783963A 申请公布日 2021-05-11
分类号 G06F16/25;G06F16/958;G06F40/284;G06Q30/00 分类 计算;推算;计数;
发明人 谭继军;李阳;谢蓬莲 申请(专利权)人 上海数喆数据科技有限公司
代理机构 成都嘉企源知识产权代理有限公司 代理人 何朝友
地址 200000 上海市杨浦区国和路60号(集中登记地)
法律状态 -

摘要

摘要 本发明公开了一种基于商圈划分的企业线下与线上多源数据整合方法,包括下述几个阶段:第一阶段:对线上的百万级样本数据进行商圈匹配,主要完成将大量的抓取样本放入特定商圈的工作,以便降低下一步匹配样本所在商场的计算量,提高匹配效率和精度;第二阶段:对各个1级商圈进行操作,将每个样本在某些商圈的可能性做出预测,并对可能的1.5级商圈进行排序匹配;第三阶段:分别就地址、商户名和门牌号综合计算相似性得分匹配。本发明将线上的企业数据与线下的经营实体对应,拓宽了企业信息的维度,通过程序化的方法,减轻了人工匹配的工作量;另外,本发明还提供一种基于商圈划分的企业线下与线上多源数据整合装置,便于实现多源数据的整合。