数据归一化方法、用户画像提供方法、设备及存储介质

基本信息

申请号 CN201810175528.0 申请日 -
公开(公告)号 CN108399249B 公开(公告)日 2018-08-14
申请公布号 CN108399249B 申请公布日 2018-08-14
分类号 G06F16/245(2019.01)I;G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 刘俊 申请(专利权)人 上海精数信息科技有限公司
代理机构 上海隆天律师事务所 代理人 上海精数信息科技有限公司
地址 200333上海市普陀区真北路958号20幢1354室
法律状态 -

摘要

摘要 本发明提供一种数据归一化方法、用户画像提供方法、设备及存储介质,所述数据归一化方法包括:S110:自n个数据源采集用户i的人口属性j的数据取值;S120:判断人口属性j的属性类型;S130:若所述人口属性j为连续型,则采用相关性加权均值法计算用户i的人口属性j的归一化值:S140:若所述人口属性j为离散型,则采用贝叶斯投票法计算用户i的人口属性j的归一化值。本发明提供的方法和设备在做跨数据源的数据归一时,充分考虑了不同数据源的差异性,对于不同数据源赋予了不同的权值,针对均值法和投票法分别采用了相关性加权和贝叶斯方法,对权值进行了合理的分配,平衡不同数据源可能存在的问题,得到最合理的一个人口属性跨数据源归一值。