基于神经网络识别互联网网站所属业态的方法、装置以及计算机可读存储介质

基本信息

申请号 CN202010932371.9 申请日 -
公开(公告)号 CN112149413A 公开(公告)日 2020-12-29
申请公布号 CN112149413A 申请公布日 2020-12-29
分类号 G06F40/284(2020.01)I 分类 计算;推算;计数;
发明人 杨菁林;吴震;贺敏;唐积强;张露晨;林绅文;董琳;马秀娟;施力;张林波;陈梓瑄;潘晓;刘刚;胡晓光;周洋 申请(专利权)人 深圳市任子行科技开发有限公司
代理机构 深圳市顺天达专利商标代理有限公司 代理人 国家计算机网络与信息安全管理中心;深圳市任子行科技开发有限公司
地址 100029北京市朝阳区裕民路甲3号
法律状态 -

摘要

摘要 本发明提供一种基于神经网络识别互联网网站所属业态的方法、装置以及计算机可读存储介质。该方法包括:获取互联网网站业态的文本数据集,从所述文本数据集中提取文本特征词;基于所述文本特征词对所述文本特征词进行词向量化以获取词向量序列;将所述词向量序列分别输入递归神经网络及卷积神经网络模型,分别得到所述递归神经网络及卷积神经网络模型输出的目标特征向量,并将所述目标特征向量进行并联拼接;将已拼接的所述目标特征向量输入全连接神经网络,最后输出概率预测向量;查找所述概率预测向量中的最大值,并以所述最大值对应的业态作为所述互联网网站的所属业态。通过本发明,实现了高精度识别互联网网站的所属业态。