一种基于深度学习算法的企业行业二级行业多标签分类器

基本信息

申请号 CN202110491360.6 申请日 -
公开(公告)号 CN113407644A 公开(公告)日 2021-09-17
申请公布号 CN113407644A 申请公布日 2021-09-17
分类号 G06F16/28(2019.01)I;G06N3/04(2006.01)I 分类 计算;推算;计数;
发明人 陈鹏;王树志;梁正尧;马金河 申请(专利权)人 国科元科技(北京)有限公司
代理机构 深圳市圳博友邦专利代理事务所(普通合伙) 代理人 陈烈军
地址 100089北京市海淀区中关村北二条13号7幢4层402房间
法律状态 -

摘要

摘要 本发明公开了一种基于深度学习算法的企业行业二级行业多标签分类器,由采集模块、预处理模块、管理模块、模型建立模块、训练验证模块、输入模块、显示模块组成,其中:采集模块用于采集企业经营范围信息;预处理模块用于对企业经营范围信息进行预处理;管理模块用于对企业经营范围信息进行人工标引,并制作用于多标签分类训练的训练集、验证集和测试集;模型建立模块用于使用训练集建立Albert+TextCNN模型;训练验证模块用于对建立的Albert+TextCNN模型进行训练,并验证正确率;本发明的有益效果是:实现了对企业二级行业的多标签分类,并改进了现有方法所需训练时间过长的问题;模块化设计,也可以进行单标签分类,并且准确率较现有方法相比具有很大的提高。