一种可用于网络信息检测的语义相似度学习方法
基本信息
申请号 | CN201910311317.X | 申请日 | - |
公开(公告)号 | CN110147798A | 公开(公告)日 | 2019-08-20 |
申请公布号 | CN110147798A | 申请公布日 | 2019-08-20 |
分类号 | G06K9/46;G06K9/62;G06F16/906 | 分类 | 计算;推算;计数; |
发明人 | 徐征;杨恩好 | 申请(专利权)人 | 北京彼维网络技术有限公司 |
代理机构 | 北京慧泉知识产权代理有限公司 | 代理人 | 北京彼维网络技术有限公司 |
地址 | 101399 北京市顺义区赵全营镇兆丰产业基地园盈路7号 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种可用于网络信息检测的语义相似度学习方法,对于文本数据,包括:步骤1、基于潜在狄利克雷分布模型对文本数据建模;步骤2、导出编码数据语义信息的特征映射来表征网络文本信息;步骤3、导出概率相似度函数,用于网络文本数据检测。对于图像数据,包括:步骤1、基于高斯混合模型对图像数据建模;步骤2、导出编码数据语义信息的特征映射来表征网络图像信息;步骤3、导出概率相似度函数,用于网络图像信息检测。本发明方法采用概率相似度函数区别于传统相似度函数之处在于,是网络信息数据、隐变量和产生式模型参数的函数,可以更好地适应数据分布。 |
