专利双语句对加工方法及系统
基本信息
申请号 | CN201911064809.X | 申请日 | - |
公开(公告)号 | CN110807337B | 公开(公告)日 | 2021-11-12 |
申请公布号 | CN110807337B | 申请公布日 | 2021-11-12 |
分类号 | G06F40/58(2020.01)I;G06F40/242(2020.01)I;G06F40/166(2020.01)I;G06F40/137(2020.01)I;G06F40/131(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 张孝飞;张迁;马伟;李帅;马毓昭 | 申请(专利权)人 | 北京中献电子技术开发有限公司 |
代理机构 | 中科专利商标代理有限责任公司 | 代理人 | 鄢功军 |
地址 | 100081北京市海淀区气象路50号中知大厦 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及机器翻译技术领域,尤其涉及一种专利双语句对加工方法及系统;所述方法包括以下步骤:获取专利篇章级双语对齐语料;提取专利双语篇章级文章的内容特征;根据内容特征,对双语对齐篇章级语料进行内容模块的切分并分级处理;根据内容分级模块结果进行段落模块切分;对不同段落模块进行分类整理;根据段落模块的分类整理结果,进行句子级对齐的分类整理。本发明所公开的专利双语句对加工方法及系统,在统计翻译的基础上,从专利领域出发,在对专利文献分析的基础上,形成专利知识库,再结合神经网络翻译,实现了专利双语句对库的自动抽取和生成,极大的提高了效率和准确率,有利于快速建立专利领域双语句对语料库。 |
