训练数据的生成方法、装置、终端及可读介质

基本信息

申请号 CN201910846968.9 申请日 -
公开(公告)号 CN110765235A 公开(公告)日 2020-02-07
申请公布号 CN110765235A 申请公布日 2020-02-07
分类号 G06F16/33;G06F16/35;G06F40/289;G06F40/30 分类 计算;推算;计数;
发明人 胡上峰;靳志业 申请(专利权)人 深圳市人马互动科技有限公司
代理机构 深圳中细软知识产权代理有限公司 代理人 深圳市人马互动科技有限公司
地址 518052 广东省深圳市南山区粤海街道高新南环路29号留学生创业大厦2007室
法律状态 -

摘要

摘要 本发明实施例公开了一种训练数据的生成方法、装置、计算机设备及存储介质,包括:获取文本语料,通过语法解析和/或语义分析及处理获取与所述文本语料对应的目标有向图;根据所述目标有向图生成目标训练数据,所述目标训练数据可用于对机器学习模型进行训练,以使所述机器学习模型具备基于所述文本语料中包含的常识知识进行推理的能力。另外,本发明实施例还公开了一种基于常识知识的语句推理方法及装置。通过上述方式,能够解析自然语言文本的文本语料中的语法及语义关系,并生成对应的目标训练数据,并根据该训练数据对机器学习模型进行训练,以实现基于文本语料中的语法语义关系的推理。