专利双语句对加工方法及系统

基本信息

申请号 CN201911064809.X 申请日 -
公开(公告)号 CN110807337B 公开(公告)日 2021-11-12
申请公布号 CN110807337B 申请公布日 2021-11-12
分类号 G06F40/58(2020.01)I;G06F40/242(2020.01)I;G06F40/166(2020.01)I;G06F40/137(2020.01)I;G06F40/131(2020.01)I 分类 计算;推算;计数;
发明人 张孝飞;张迁;马伟;李帅;马毓昭 申请(专利权)人 北京中献电子技术开发有限公司
代理机构 中科专利商标代理有限责任公司 代理人 鄢功军
地址 100081北京市海淀区气象路50号中知大厦
法律状态 -

摘要

摘要 本发明涉及机器翻译技术领域,尤其涉及一种专利双语句对加工方法及系统;所述方法包括以下步骤:获取专利篇章级双语对齐语料;提取专利双语篇章级文章的内容特征;根据内容特征,对双语对齐篇章级语料进行内容模块的切分并分级处理;根据内容分级模块结果进行段落模块切分;对不同段落模块进行分类整理;根据段落模块的分类整理结果,进行句子级对齐的分类整理。本发明所公开的专利双语句对加工方法及系统,在统计翻译的基础上,从专利领域出发,在对专利文献分析的基础上,形成专利知识库,再结合神经网络翻译,实现了专利双语句对库的自动抽取和生成,极大的提高了效率和准确率,有利于快速建立专利领域双语句对语料库。