一种网页分类方法、系统、终端及存储介质

基本信息

申请号 CN201810465784.3 申请日 -
公开(公告)号 CN108920492A 公开(公告)日 2018-11-30
申请公布号 CN108920492A 申请公布日 2018-11-30
分类号 G06F17/30;G06K9/62 分类 计算;推算;计数;
发明人 张君晖 申请(专利权)人 广州舜飞信息科技有限公司
代理机构 广州嘉权专利商标事务所有限公司 代理人 广州舜飞信息科技有限公司
地址 510665 广东省广州市天河区棠东东路5号远洋创意园B-420
法律状态 -

摘要

摘要 本发明公开了一种网页分类方法、系统、终端及存储介质,该方法包括获取网页链接信息;将获取得到的网页链接信息输入至文本分类模型进行分类处理后,输出所述网页链接信息对应的站点分类结果;其中,所述文本分类模型是基于Boosting集成方法而训练得到的文本分类模型。该系统包括获取模块和处理模块。该终端包括用于存储程序的存储器以及用于加载程序以执行所述方法步骤的处理器。通过使用本发明,能够快速且准确地对网页进行分类。本发明作为一种网页分类方法、系统、终端及存储介质可广泛应用于文本分类领域中。