一种基于机器学习的侵权网页判断方法

基本信息

申请号 CN201811223048.3 申请日 -
公开(公告)号 CN109408947A 公开(公告)日 2019-03-01
申请公布号 CN109408947A 申请公布日 2019-03-01
分类号 G06F17/50;G06N99/00 分类 计算;推算;计数;
发明人 林俊 申请(专利权)人 杭州刀豆网络科技有限公司
代理机构 杭州华知专利事务所(普通合伙) 代理人 杭州刀豆网络科技有限公司
地址 310000 浙江省杭州市余杭区仓前街道良睦路1288号6号楼302-8室
法律状态 -

摘要

摘要 本发明公开了一种基于机器学习的侵权网页判断方法,包括:网页源数据预处理生成训练集和测试集;使用训练集生成分析模型、测试集测试不同阈值下分析模型的性能指标及人工选择最优阈值;使用分析模型和最优阈值对网页进行分析判断是否为侵权网页。本发明解决了现有采用人工审核网页是否侵权成本高昂、没有统一审核标准导致审核缓慢的技术问题。