一种数据处理方法及装置、可读存储介质

基本信息

申请号 CN202011644826.3 申请日 -
公开(公告)号 CN112734035A 公开(公告)日 2021-04-30
申请公布号 CN112734035A 申请公布日 2021-04-30
分类号 G06N3/08;G06K9/62 分类 计算;推算;计数;
发明人 张翼;顾华鑫;李辰;廖强 申请(专利权)人 成都佳华物链云科技有限公司
代理机构 北京超凡宏宇专利代理事务所(特殊普通合伙) 代理人 张萌
地址 610000 四川省成都市天府新区华阳街道华府大道一段1号1号楼23A楼06-08号
法律状态 -

摘要

摘要 本申请提供一种数据处理方法及装置、可读存储介质。数据处理方法包括:获取多张样本图片和预先训练好的多个验证模型;每张样本图片对应一个标注标签;将多张样本图片分别输入到多个验证模型中,获得每个验证模型输出的验证结果;验证结果中包括:每张样本图片的标签为预设的多个标签中的每个标签的概率;多个标签不相同;标注标签属于多个标签中的标签;根据多个验证模型输出的验证结果确定每张样本图片对应的标注标签与多个标签之间的平均交叉熵;根据多张样本图片的平均交叉熵确定多个标签的拟合分布;根据每张样本图片的平均交叉熵在拟合分布中的概率确定每张样本图片对应的标注标签是否为正确标签。该方法提高标签清洗的准确度和效率。