训练数据的构建方法、装置、计算机设备及存储介质
基本信息
申请号 | CN202110050147.1 | 申请日 | - |
公开(公告)号 | CN112765992A | 公开(公告)日 | 2021-05-07 |
申请公布号 | CN112765992A | 申请公布日 | 2021-05-07 |
分类号 | G06F40/30(2020.01)I;G06F16/36(2019.01)I;G06N5/02(2006.01)I;G06F40/253(2020.01)I | 分类 | - |
发明人 | 胡上峰 | 申请(专利权)人 | 深圳市人马互动科技有限公司 |
代理机构 | 深圳中细软知识产权代理有限公司 | 代理人 | 孙凯乐 |
地址 | 518052广东省深圳市南山区粤海街道高新南环路29号留学生创业大厦2007室 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例公开了一种训练数据的构建方法,包括:获取待识别的图像;对所述待识别的图像进行内容识别,得到图像内容识别结果;根据所述图像内容识别结果构建目标训练数据,所述目标训练数据用于对语义模型进行训练,或用于构建语义知识网络。上述方法中基于图像内容识别结果构建的目标训练数据在语义内容分布上弥补了文本数据的不足,使整体训练数据更加均衡,从而使得得到的语义模型或构建的语义知识网络更加全面和准确。此外,还提出了一种训练数据的构建装置、计算机设备及存储介质。 |
