一种文本比对方法、装置、计算机设备及可读存储介质

基本信息

申请号 CN202011292846.9 申请日 -
公开(公告)号 CN112395851A 公开(公告)日 2021-02-23
申请公布号 CN112395851A 申请公布日 2021-02-23
分类号 G06F40/194(2020.01)I; 分类 计算;推算;计数;
发明人 郭叶;武光鼎;曹琴 申请(专利权)人 北京北大英华科技有限公司
代理机构 北京三友知识产权代理有限公司 代理人 许曼;贾磊
地址 100080北京市海淀区中关村大街27号中关村大厦九层901-902室
法律状态 -

摘要

摘要 本发明提供了一种文本比对方法、装置、计算机设备及可读存储介质,所述方法包括:从第一文本中获取若干第一子文本以及从第二文本中获取若干第二子文本;根据所述第一子文本以及第二子文本获取若干相似度值;所述相似度值为一个第一子文本与一个第二子文本之间相似的程度;根据所述相似度值获取相似文本对,所述相似文本对包含第一子文本以及与该第一子文本相似度值最大的第二子文本;获取所述相似文本对中的第一子文本与第二子文本的至少一个区别特征。通过上述方法,整个过程无需人工参与,减少人工比对文本的出错率,并大大提升了文本的比对效率,所以具有较高的实用价值。