网页内容的过滤方法及服务器

基本信息

申请号 CN201310065929.8 申请日 -
公开(公告)号 CN104021126B 公开(公告)日 2020-02-07
申请公布号 CN104021126B 申请公布日 2020-02-07
分类号 G06F16/957;H04L29/06 分类 计算;推算;计数;
发明人 王涛伟 申请(专利权)人 深圳市世纪光速信息技术有限公司
代理机构 北京华沛德权律师事务所 代理人 刘杰
地址 518057 广东省深圳市南山区粤海街道科技中一路腾讯大厦16层
法律状态 -

摘要

摘要 本发明公开了一种网页内容的过滤方法及服务器,涉及电子设备应用领域,能够解决由于误将垃圾图片判断为主体内容导致的漏滤垃圾图片的问题。所述方法包括:将待过滤网页的网页统一资源定位符URL地址与所述待过滤网页中多媒体内容的多媒体URL地址进行关联,并保存在关系数据库中,所述关系数据库用于保存网页URL地址与多媒体URL地址之间的映射关系;判断所述关系数据库中同一个多媒体URL地址所关联的网页URL地址是否多于一个,得出判断结果;如果所述判断结果为是,则将所述多媒体URL地址所链接的多媒体内容确定为垃圾多媒体内容,将所述垃圾多媒体内容进行过滤。本发明应用于网络访问的过程中。