数据归一化方法、用户画像提供方法、设备及存储介质
基本信息
申请号 | CN201810175528.0 | 申请日 | - |
公开(公告)号 | CN108399249B | 公开(公告)日 | 2018-08-14 |
申请公布号 | CN108399249B | 申请公布日 | 2018-08-14 |
分类号 | G06F16/245(2019.01)I;G06K9/62(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 刘俊 | 申请(专利权)人 | 上海精数信息科技有限公司 |
代理机构 | 上海隆天律师事务所 | 代理人 | 上海精数信息科技有限公司 |
地址 | 200333上海市普陀区真北路958号20幢1354室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种数据归一化方法、用户画像提供方法、设备及存储介质,所述数据归一化方法包括:S110:自n个数据源采集用户i的人口属性j的数据取值;S120:判断人口属性j的属性类型;S130:若所述人口属性j为连续型,则采用相关性加权均值法计算用户i的人口属性j的归一化值:S140:若所述人口属性j为离散型,则采用贝叶斯投票法计算用户i的人口属性j的归一化值。本发明提供的方法和设备在做跨数据源的数据归一时,充分考虑了不同数据源的差异性,对于不同数据源赋予了不同的权值,针对均值法和投票法分别采用了相关性加权和贝叶斯方法,对权值进行了合理的分配,平衡不同数据源可能存在的问题,得到最合理的一个人口属性跨数据源归一值。 |
