基于网页文本分类的数据处理方法、智能终端及存储介质

基本信息

申请号 CN201910682113.7 申请日 -
公开(公告)号 CN110413786B 公开(公告)日 2021-12-28
申请公布号 CN110413786B 申请公布日 2021-12-28
分类号 G06F16/35(2019.01)I;G06F16/338(2019.01)I;G06F16/951(2019.01)I;G06N3/04(2006.01)I 分类 计算;推算;计数;
发明人 张玳辉 申请(专利权)人 北京智游网安科技有限公司
代理机构 深圳市君胜知识产权代理事务所(普通合伙) 代理人 王永文;陈专
地址 100000北京市海淀区东北旺西路8号中关村软件园10号楼2层207-2(国永融通大厦)
法律状态 -

摘要

摘要 本发明公开了基于网页文本分类的数据处理方法、智能终端及存储介质,所述方法包括:从数据库中选取满足所有分类应用描述的分类样本的文本数据进行清洗和标注;将经过清洗和标注后的文本数据输入到循环神经网络模型中进行训练,所述循环神经网络模型根据损失曲线调整拟合参数;将经过清洗和序列化后的文本数据输入到所述循环神经网络模型,所述循环神经网络模型输出预测值;根据输出的所述预测值,所述循环神经网络模型将数据库中入库的信息进行分类,通过后台筛选出相关分类的应用并进行展示。本发明通过深度学习算法将文本信息进行特征提取训练,输出预测值,自动将数据库中入库的信息进行分类,用户只需要通过后台即可筛选出相关分类的应用。