文本相似度检测方法、装置及电子设备

基本信息

申请号 CN201911321980.4 申请日 -
公开(公告)号 CN111104484B 公开(公告)日 2021-09-03
申请公布号 CN111104484B 申请公布日 2021-09-03
分类号 G06F16/33;G06F21/16 分类 计算;推算;计数;
发明人 王超;熊英超 申请(专利权)人 南京中孚信息技术有限公司
代理机构 北京超凡宏宇专利代理事务所(特殊普通合伙) 代理人 董艳芳
地址 210000 江苏省南京市浦口区江浦街道仁山路1号园区2号楼办公室东侧ER202室
法律状态 -

摘要

摘要 本发明提供了一种文本相似度检测方法、装置及电子设备,涉及数据处理技术领域,本发明在获取到两个文本的初始指纹特征后,基于滑动窗口算法和数字指纹的大小对初始指纹特征进行了目标数字指纹的提取,且进行目标数字指纹的提取时,下一个滑动窗口的起始点与前一个滑动窗口内所提取出的目标数字指纹有关,这样在保证检测准确度的基础上,减少了目标指纹特征中数字指纹的数量,降低了数字指纹密度,从而降低了相似度计算时的计算量,提高了文本相似度检测的检测速度。