数据收集方法及装置
基本信息
申请号 | CN201811542893.7 | 申请日 | - |
公开(公告)号 | CN109740750A | 公开(公告)日 | 2021-06-15 |
申请公布号 | CN109740750A | 申请公布日 | 2021-06-15 |
分类号 | G06N3/08 | 分类 | 计算;推算;计数; |
发明人 | 李超然 | 申请(专利权)人 | 北京深极智能科技有限公司 |
代理机构 | 北京金咨知识产权代理有限公司 | 代理人 | 宋教花 |
地址 | 100041 北京市石景山区实兴大街30号院3号楼2层B-0035房间 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种数据收集方法及装置,该方法包括:接收待收集样本数据;获取样本收集数据集中属于所述待收集样本数据所属类别的样本数据的当前占比,所述样本收集数据集为大小固定的数据集;根据所述当前占比和所述待收集样本数据所属类别的样本数据的目标占比确定所述待收集样本数据所属类别的样本数据的收集概率;根据所述收集概率将所述待收集样本数据添加至所述样本收集数据集中,以用于训练神经网络模型。通过上述方案能够在不断有新样本生成的情况下得到满足机器学习的类别分布要求的样本数据集。 |
