图像数据清洗方法及装置、电子设备和介质

基本信息

申请号 CN202011290397.4 申请日 -
公开(公告)号 CN112348107A 公开(公告)日 2021-02-09
申请公布号 CN112348107A 申请公布日 2021-02-09
分类号 G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 薛学通;任晖;杨敏 申请(专利权)人 百度(中国)有限公司
代理机构 北京市汉坤律师事务所 代理人 姜浩然;吴丽丽
地址 200041上海市浦东新区张江高科技园区郭守敬路498号6幢9506室
法律状态 -

摘要

摘要 本公开提供一种图像数据清洗方法及装置、电子设备和介质,涉及人工智能技术领域,具体为深度学习和计算机视觉技术领域。所述图像数据清洗方法包括:提供一种图像数据清洗方法,包括:获取目标标签的至少一个标准图像;确定所述至少一个标准图像的聚类中心;提取多个待清洗图像中每一个待清洗图像的特征;基于所述多个待清洗图像的特征和所述聚类中心,确定每一个待清洗图像与所述至少一个标准图像的相似度值;以及基于所确定的相似度值,从所述多个待清洗图像中选取若干个待清洗图像以形成所述目标标签的图像集。