一种评价数据的特征分布和置信度的方法及装置

基本信息

申请号 CN201911185336.9 申请日 -
公开(公告)号 CN111062486A 公开(公告)日 2020-04-24
申请公布号 CN111062486A 申请公布日 2020-04-24
分类号 G06N20/00;G06K9/00;G06K9/62;G06Q40/02 分类 计算;推算;计数;
发明人 史岩;张君;强晓雯;菅鹏;李卓;夏珣;殷朋朋;武哲;吕春明;谭世鹏;仲崇龙 申请(专利权)人 北京国腾联信科技有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 北京国腾联信科技有限公司
地址 100000 北京市西城区平安里西大街28号中海国际中心6层601室
法律状态 -

摘要

摘要 本发明提供一种评价数据的特征分布和置信度的方法及装置,在获取到特征数据集之后,对特征数据集中属于同一特征数据且从不同数据来源的多个数值进行交叉验证,以将多个数值划分至不具有数值一致性的数值组和各个具有数值一致性的数值组中,获得各个具有数值一致性的数值组各自对应的目标数值,计算不具有数值一致性的数值组中各个数值的预测概率、各个目标数值的预测概率以及进行交叉验证后的特征数据集的置信度,并作为模型的输入对模型进行使用或训练测试,以通过同一特征数据的数值的预测概率分布和特征数据集的置信度来代替现有最佳估计值方式得到的单一值,从而体现数值之间的差异并提高模型的准确度。