一种异常文本的检测方法、装置、电子设备及存储介质

基本信息

申请号 CN202011611515.7 申请日 -
公开(公告)号 CN112699657A 公开(公告)日 2021-04-23
申请公布号 CN112699657A 申请公布日 2021-04-23
分类号 G06F40/194;G06F40/216;G06F40/211;G06K9/62 分类 计算;推算;计数;
发明人 柯维海;陈超鸿;吴树钏;陈杰永 申请(专利权)人 广东德诚大数据科技有限公司
代理机构 深圳国海智峰知识产权代理事务所(普通合伙) 代理人 刘军锋
地址 526060 广东省肇庆市古塔中路市就业训练中心大楼第六层608室
法律状态 -

摘要

摘要 本申请提供了一种异常文本的检测方法、装置、电子设备及存储介质。该方法包括:获取参考文本中的参考分句;获取检测文本中的目标分句;当判定所述目标分句为设定分句时,获取所述设定分句的总数;所述设定分句与所述参考分句相似;根据所述设定分句的总数和所述参考文本中的参考分句的总数以及所述检测文本中的目标分句的总数获取文本相似度;当所述文本相似度大于第一预设阈值时,则确定所述检测文本为异常文本;由于可以自动检测出抄袭文本,从而提高了检测的准确性。