识别模型训练方法及装置

基本信息

申请号 CN202110595230.7 申请日 -
公开(公告)号 CN113361253A 公开(公告)日 2021-09-07
申请公布号 CN113361253A 申请公布日 2021-09-07
分类号 G06F40/205(2020.01)I;G06F40/284(2020.01)I;G06F40/295(2020.01)I;G06Q50/18(2012.01)I 分类 计算;推算;计数;
发明人 王安;李长亮 申请(专利权)人 北京金山数字娱乐科技有限公司
代理机构 北京智信禾专利代理有限公司 代理人 李晓庆
地址 100085北京市海淀区西二旗中路33号院5号楼11层002号
法律状态 -

摘要

摘要 本申请提供识别模型训练方法及装置,其中,所述方法包括获取多个目标样本文档,并将每个目标样本文档输入解析模型,获得每个目标样本文档的多个目标文本以及每个目标文本的实体类型;基于每个目标文本的实体类型,以及每个目标文本与其他目标文本之间的距离,确定每个目标文本与其他目标文本之间的关联关系;将所述目标文本作为目标样本文本,将所述目标文本与其他目标文本之间的关联关系作为所述目标样本文本的目标样本标签;基于所述目标样本文本以及所述目标样本文本对应的目标样本标签对识别模型进行训练,以获得训练后的所述识别模型。