样本获取方法、模型训练方法、关系预测方法及装置
基本信息
申请号 | CN202111132807.7 | 申请日 | - |
公开(公告)号 | CN113836244A | 公开(公告)日 | 2021-12-24 |
申请公布号 | CN113836244A | 申请公布日 | 2021-12-24 |
分类号 | G06F16/28(2019.01)I;G06K9/62(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 汪子芃;张雷;刘静蕾;张莹莹;连代星;庞德智;王顺利;程仕湘;李胜男;尹洋标;袁东 | 申请(专利权)人 | 天弘基金管理有限公司 |
代理机构 | 北京超凡宏宇专利代理事务所(特殊普通合伙) | 代理人 | 唐正瑜 |
地址 | 300450天津市滨海新区自贸区(中心商务区)响螺湾旷世国际大厦A座1704-241号 | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种样本获取方法、模型训练方法、关系预测方法及装置,涉及计算机技术领域。该方法通过获取关系知识图谱,然后从关系知识图谱中筛选出多个第一类实体对,每个第一类实体对包括不具有直接关系的两个实体,获取每个第一类实体对的联合重要度,然后将初始采样概率与联合重要度相乘,得到每个第一类实体对的采样概率,再根据全部第一类实体对的采样概率对多个第一类实体对进行采样,得到作为负样本的实体对,这样可从所有的第一类实体对中按照采样概率采样部分的第一类实体对作为模型训练的负样本,可有效减少模型训练的数据量,减少服务器硬件资源的占用,提高服务器性能,进而提高模型训练效率。 |
