一种可用于网络信息检测的语义相似度学习方法

基本信息

申请号 CN201910311317.X 申请日 -
公开(公告)号 CN110147798A 公开(公告)日 2019-08-20
申请公布号 CN110147798A 申请公布日 2019-08-20
分类号 G06K9/46;G06K9/62;G06F16/906 分类 计算;推算;计数;
发明人 徐征;杨恩好 申请(专利权)人 北京彼维网络技术有限公司
代理机构 北京慧泉知识产权代理有限公司 代理人 北京彼维网络技术有限公司
地址 101399 北京市顺义区赵全营镇兆丰产业基地园盈路7号
法律状态 -

摘要

摘要 本发明涉及一种可用于网络信息检测的语义相似度学习方法,对于文本数据,包括:步骤1、基于潜在狄利克雷分布模型对文本数据建模;步骤2、导出编码数据语义信息的特征映射来表征网络文本信息;步骤3、导出概率相似度函数,用于网络文本数据检测。对于图像数据,包括:步骤1、基于高斯混合模型对图像数据建模;步骤2、导出编码数据语义信息的特征映射来表征网络图像信息;步骤3、导出概率相似度函数,用于网络图像信息检测。本发明方法采用概率相似度函数区别于传统相似度函数之处在于,是网络信息数据、隐变量和产生式模型参数的函数,可以更好地适应数据分布。