一种训练样本的选取方法、系统、存储介质和电子设备

基本信息

申请号 CN202111017696.5 申请日 -
公开(公告)号 CN113469290A 公开(公告)日 2021-10-01
申请公布号 CN113469290A 申请公布日 2021-10-01
分类号 G06K9/62(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 王少将;唐会军;刘拴林;梁堃;陈建 申请(专利权)人 北京数美时代科技有限公司
代理机构 北京轻创知识产权代理有限公司 代理人 翟磊
地址 100012北京市朝阳区来广营西路5号院诚盈中心3号楼14层1401-1404单元
法律状态 -

摘要

摘要 本发明涉及一种训练样本的选取方法、系统、存储介质和电子设备,将任一数据样本输入现有的已训练好的数据模型中,根据输出结果计算该数据样本的信息熵,并进行进行归一化,直至得到多个数据样本的归一化后的信息熵并按照从大到小顺序排列,前个归一化后的信息熵对应的数据样本均作为训练样本,也就是挑选出能够对模型训练起到的较大效果的数据样本作为训练样本,然后再进行新模型的训练,既保证新训练出的模型的精度,还能降低标注成本。