机器学习模型训练方法和装置、文本识别方法和装置

基本信息

申请号 CN202210110721.2 申请日 -
公开(公告)号 CN114139729A 公开(公告)日 2022-03-04
申请公布号 CN114139729A 申请公布日 2022-03-04
分类号 G06N20/00(2019.01)I;G06N3/04(2006.01)I;G06V30/40(2022.01)I 分类 计算;推算;计数;
发明人 刘军;秦勇 申请(专利权)人 北京易真学思教育科技有限公司
代理机构 中国贸促会专利商标事务所有限公司 代理人 刘剑波
地址 102200北京市昌平区未来科学城英才北三街16号院16号楼401室
法律状态 -

摘要

摘要 本公开提供一种机器学习模型训练方法和装置、文本识别方法和装置。机器学习模型训练方法包括:对样本图像进行预设变换处理,以生成待处理图像;将待处理图像输入第一机器学习模型,以得到n个特征图,其中n个特征图的尺寸互不相同、且均小于待处理图像的尺寸,n为大于2的自然数;将n个特征图中除尺寸最大的特征图之外的其它n‑1个特征图输入第二机器学习模型,以得到识别概率矩阵;根据识别概率矩阵对第一机器学习模型和第二机器学习模型进行训练;在n个特征图中,选择一个特征图作为待处理特征图;将待处理特征图输入增广模型,以得到增广样本;将增广样本输入第一机器学习模型,以便利用增广样本训练第一机器学习模型和第二机器学习模型。