基于机器学习的钓鱼网站URL检测方法及系统

基本信息

申请号 CN202110231656.4 申请日 -
公开(公告)号 CN112948725A 公开(公告)日 2021-06-11
申请公布号 CN112948725A 申请公布日 2021-06-11
分类号 G06F16/955;G06N20/00 分类 计算;推算;计数;
发明人 于金龙;王智民;王高杰;卯路宁 申请(专利权)人 桐梓县富源农业发展有限公司
代理机构 北京润平知识产权代理有限公司 代理人 肖冰滨;王晓晓
地址 100085 北京市海淀区上地信息路12号1幢2层C202室
法律状态 -

摘要

摘要 本发明提供一种基于机器学习的钓鱼网站URL检测方法及系统,属于信息安全领域。所述方法包括:对待测URL进行解析,提取待测URL的结构信息和组成待测URL的单词;根据所述待测URL、所述待测URL的结构信息和组成待测URL的单词提取URL特征;将所述URL特征输入训练好的URL检测模型进行检测,得到待测URL为异常URL的概率。与传统的黑名单技术相比,本发明的URL检测方法从URL中提取特征训练模型进行预测,覆盖范围更广,检测结果更加准确,采用训练好的URL模型进行检测,不需要频繁进行更新,且占用资源较少,普通计算机也能够运行,满足广大用户的需求。