一种电商商品数据去重方法

基本信息

申请号 CN202111169369.1 申请日 -
公开(公告)号 CN113886586A 公开(公告)日 2022-01-04
申请公布号 CN113886586A 申请公布日 2022-01-04
分类号 G06F16/35(2019.01)I;G06F16/33(2019.01)I;G06F16/25(2019.01)I;G06F40/216(2020.01)I;G06F40/289(2020.01)I;G06K9/62(2006.01)I;G06Q30/06(2012.01)I 分类 计算;推算;计数;
发明人 何承隆 申请(专利权)人 欧菲斯集团股份有限公司
代理机构 重庆金橙专利代理事务所(普通合伙) 代理人 李梅
地址 401120重庆市渝北区卉竹路2号6幢13层2号
法律状态 -

摘要

摘要 本发明公开了一种电商商品数据去重方法,包括以下所述工作步骤:(1)对获取的到的商品原始数据做集中化处理,并对集中化的数据进行ETL处理;(2)对ETL处理商品进行商品特征标签打标,并且补全更新商品的缺省特征值;(3)计算出所有商品的数据集合备选集,并计算出所有商品的特征词向量;(4)把得到的所有商品的商品数据集的特征词转换而来的特征向量数据集。本发明通过形成产业链上下游认同的数据标准,打通产业链的话语体系,可降低平台的沟通成本,将其使用效率提高,通过渠道商和企业客户会根据自己的商品目录、采购目录设置同一套编码系统,使得上中下游的数字化互通互联,降低其沟通成本。