基于跨域数据的评估模型的优化方法及设备

基本信息

申请号 CN202110426307.8 申请日 -
公开(公告)号 CN113128594A 公开(公告)日 2021-07-16
申请公布号 CN113128594A 申请公布日 2021-07-16
分类号 G06K9/62(2006.01)I;G06N20/00(2019.01)I 分类 计算;推算;计数;
发明人 尹悦;杨琦琦 申请(专利权)人 连通(杭州)技术服务有限公司
代理机构 上海百一领御专利代理事务所(普通合伙) 代理人 王奎宇
地址 310052浙江省杭州市滨江区长河街道越达巷79号1幢801室
法律状态 -

摘要

摘要 本申请的目的是提供基于跨域数据的评估模型的优化方法及设备,本申请通过获取并确定至少三种数据源的原始数据和准确率;其中,每种所述数据源的原始数据包括至少两条;将所述准确率最高时对应的数据源的原始数据作为训练集;按照准确率从高到低的顺序将数据源的原始数据加入至训练集进行模型训练,以得到模型性能最优的且用于对不同数据源的原始数据进行因变量评估的最终评估模型,不仅保证了模型训练过程中的训练集的多样性,还能使模型能最大化的满足实际应用场景的需求,进一步提高训练所得模型的精确度,从而可以最大程度避免错误的且来源于不同分布的数据源所带来的负面影响,以克服机器学习实践中常见的跨域数据的数据质量问题。