一种数据标注方法和装置以及疾病分类模型训练方法

基本信息

申请号 CN202210004573.6 申请日 -
公开(公告)号 CN114140653A 公开(公告)日 2022-03-04
申请公布号 CN114140653A 申请公布日 2022-03-04
分类号 G06V10/764(2022.01)I;G06V10/774(2022.01)I;G06K9/62(2022.01)I;G06V10/82(2022.01)I 分类 计算;推算;计数;
发明人 周昊毅;赵昕;和超;张大磊 申请(专利权)人 北京鹰瞳科技发展股份有限公司
代理机构 北京泛华伟业知识产权代理有限公司 代理人 王勇
地址 100083北京市海淀区西三环北路甲2号院2号楼4层21室
法律状态 -

摘要

摘要 本发明提供一种对样本数据集进行数据标注的方法,包括步骤:S1、获取样本数据集,其中样本数据集中的每个样本包含多个标注者分别对其进行标注的一种或多种分类标签;S2、对包含多种分类标签的样本的标签种类进行合并以将有关联的分类标签对合并且以标签对中的一个标签作为合并后的标签;其中,有关联的分类标签对是指不同的标注者对同一个样本标注的不同标签组成的成对组合;S3、基于合并后的分类标签对样本数据集中的样本进行重新进行标注。与现有技术相比,采用本发明方法可以实现对带有一定主观性的数据进行预处理以将主观性的评价使用其他具有相关性的指标客观化来获得具有普适性的标签以实现对数据的标注,然后训练相关的分类模型。