数据收集方法及装置

基本信息

申请号 CN201811542893.7 申请日 -
公开(公告)号 CN109740750B 公开(公告)日 2021-06-15
申请公布号 CN109740750B 申请公布日 2021-06-15
分类号 G06N3/08 分类 计算;推算;计数;
发明人 李超然 申请(专利权)人 北京深极智能科技有限公司
代理机构 泰和泰律师事务所 代理人 祝海燕
地址 100041 北京市石景山区实兴大街30号院3号楼2层B-0035房间
法律状态 -

摘要

摘要 本发明提供了一种数据收集方法及装置,该方法包括:接收待收集样本数据;获取样本收集数据集中属于所述待收集样本数据所属类别的样本数据的当前占比,所述样本收集数据集为大小固定的数据集;根据所述当前占比和所述待收集样本数据所属类别的样本数据的目标占比确定所述待收集样本数据所属类别的样本数据的收集概率;根据所述收集概率将所述待收集样本数据添加至所述样本收集数据集中,以用于训练神经网络模型。通过上述方案能够在不断有新样本生成的情况下得到满足机器学习的类别分布要求的样本数据集。