一种保持分类一致性的预测方法及装置

基本信息

申请号 CN202110167542.8 申请日 -
公开(公告)号 CN112507120B 公开(公告)日 2021-06-04
申请公布号 CN112507120B 申请公布日 2021-06-04
分类号 G06F16/35 分类 计算;推算;计数;
发明人 沈振雷;刘凡平 申请(专利权)人 上海二三四五网络科技有限公司
代理机构 上海唯源专利代理有限公司 代理人 曾耀先
地址 200137 上海市浦东新区杨高北路528号14幢1-5层
法律状态 -

摘要

摘要 本发明公开了一种保持分类一致性的预测方法,基于待预测样本的文本特征确定待预测样本文本特征的TOKEN编码向量,待预测样本的文本特征至少包括文本标题、文本内容以及文本来源;将待预测样本文本特征的TOKEN编码向量输入至预测模型Model以确定与待预测样本的文本特征相对应的一级分类以及与所述一级分类存在依赖关系的二级分类,所述依赖关系为上下位关系,本发明将一级分类以及二级分类一起训练,上层输出后查找依赖关系,进而去对下层进行约束,输出分两层,本发明在确定一级分类的预测结果的基础上,基于ClassMask依赖关系矩阵实现对于二级分类的预测,从而实现了训练的一次完成。本发明方法简单、流程便捷、预测精准、节约训练时间,具有极高的商业价值。