基于行业标签的互联网信息分类方法、系统及电子设备

基本信息

申请号 CN202110385341.5 申请日 -
公开(公告)号 CN113220875A 公开(公告)日 2021-08-06
申请公布号 CN113220875A 申请公布日 2021-08-06
分类号 G06F16/35(2019.01)I;G06F16/332(2019.01)I;G06F16/955(2019.01)I 分类 计算;推算;计数;
发明人 段新丰;李青龙;张立芳;张斌 申请(专利权)人 北京智慧星光信息技术有限公司
代理机构 北京智宇正信知识产权代理事务所(普通合伙) 代理人 李明卓
地址 100080北京市海淀区海淀大街8号A座22层A区
法律状态 -

摘要

摘要 本发明公开了一种基于行业标签的互联网信息分类方法、系统及电子设备,该方法包括:分别获取各个行业的主体分类和事件分类;根据事件分类得到各个行业的关键词;根据主体分类、事件分类和关键词,得到每一个行业所对应的初始标签模型;根据每一个行业所对应的初始标签模型得到初始行业标签分类模型,初始行业标签分类模型包括所有行业所对应的初始标签模型;获取训练数据集;将训练数据集输入初始行业标签分类模型中进行训练,得到最终行业标签分类模型;获取待分类互联网信息;将待分类互联网信息输入最终行业标签分类模型中进行标签分类,得到待分类互联网信息所对应的行业标签分类结果;实现了互联网信息的自动分类,提高了信息分类效率。