基于线上大数据智能聚合模式下的数据可靠性评价算法

基本信息

申请号 CN202110287067.8 申请日 -
公开(公告)号 CN113032561A 公开(公告)日 2021-06-25
申请公布号 CN113032561A 申请公布日 2021-06-25
分类号 G06F16/35;G06Q40/02 分类 计算;推算;计数;
发明人 谭继军;李阳;蒋华东 申请(专利权)人 上海数喆数据科技有限公司
代理机构 成都嘉企源知识产权代理有限公司 代理人 何朝友
地址 200000 上海市杨浦区国和路60号(集中登记地)
法律状态 -

摘要

摘要 本发明公开了一种基于线上大数据智能聚合模式下的数据可靠性评价算法,包括如下步骤:步骤1,数据源采信的权重赋值:对数据源进行信用评级,决定数据源采信的权重zi;步骤2,数据源可靠性赋值:对同一类型数据基于关键词聚类出现次数进行赋值决定数据采信分值,基于聚类出现次数进行可靠性赋值Si;步骤3,可靠性评价分值计算:取不同结果的基于聚类结果获得可靠性分Si,取这个结果所有数据源中数据源信用评价最高对应的权重系数zi,即可计算该结果可靠性性评价分值Yi=zi*Si。本发明能够自动判断不同数据结果的可靠性,自动实现“去伪存真”的可靠性评价筛选。