一种句子对齐方法及计算设备

基本信息

申请号 CN201911144378.8 申请日 -
公开(公告)号 CN112825109A 公开(公告)日 2021-05-21
申请公布号 CN112825109A 申请公布日 2021-05-21
分类号 G06F40/211;G06F40/45 分类 计算;推算;计数;
发明人 张志博;王捷 申请(专利权)人 南京贝湾信息科技有限公司
代理机构 北京思睿峰知识产权代理有限公司 代理人 谢建云;赵爱军
地址 210000 江苏省南京市玄武区玄武大道699号-22号29幢
法律状态 -

摘要

摘要 本发明公开了一种句子对齐方法,包括步骤:对第一文本和第二文本分别进行分句处理,以对应生成多条关于第一文本和第二文本的第一句子和第二句子,其中第一文本和第二文本为分别采用第一语言和第二语言表述的同一文本;利用相似度评估模型处理所述第一句子和第二句子,以生成每条第一句子与第二句子的相似度值;以及通过为每个第一句子匹配与其相似度值最大的第二句子,来将多条第一句子和第二句子进行对齐。本发明一并公开了用于执行上述方法的计算设备。