一种基于匹配学习的多标签分类学习方法

基本信息

申请号 CN201810072493.8 申请日 -
公开(公告)号 CN108256583B 公开(公告)日 2018-07-06
申请公布号 CN108256583B 申请公布日 2018-07-06
分类号 G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 翟书杰;李晨 申请(专利权)人 北京东方科诺科技发展有限公司
代理机构 北京市商泰律师事务所 代理人 黄晓军
地址 100191北京市海淀区花园路2号牡丹创业楼2层208A号
法律状态 -

摘要

摘要 本发明提供的基于匹配学习的多标签分类学习方法,首先对客户端数据进行特征值计算,得到训练集;设定训练集中的正负标签;然后计算训练集中特征集合的嵌入式表征E;计算正标签的嵌入式表征Z+和负标签的嵌入式表征Z‑;接着对E和Z+作损失计算,对E与Z‑作损失计算;依据正负损失值,采用梯度下降算法对训练集进行模型训练;当训练模型的损失值不再下降时,训练结束,否则再次训练;最后采用测试集测试该训练模型。本发明考虑了长尾标签对传统极大规模多标签分类模型学习的不利影响,提出利用特征集合和标签集合的匹配学习方法。此外,为保证模型能够扩展到大规模数据集上,采用梯度下降算法的模型学习方式,既可保证模型并行化学习,还可支持模型在线增量学习。