短句切分装置、机器翻译系统及对应切分方法和翻译方法
基本信息
申请号 | CN201310432908.5 | 申请日 | - |
公开(公告)号 | CN103530284B | 公开(公告)日 | 2016-07-06 |
申请公布号 | CN103530284B | 申请公布日 | 2016-07-06 |
分类号 | G06F17/28(2006.01)I;G06F17/27(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 任智军;张威;蒋宏飞;熊文;姜涛;张凯 | 申请(专利权)人 | 中国专利信息中心 |
代理机构 | 北京瑞恒信达知识产权代理事务所(普通合伙) | 代理人 | 中国专利信息中心 |
地址 | 100088 北京市海淀区蓟门桥西土城路6号 | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种短句切分的装置和包括该装置的机器翻译系统,该装置包括顺序相连的短句粗切分单元、短句句对齐单元、最小对齐块合并单元和短句切分训练单元;短句粗切分单元,用于将双语语料中的每个句子单独以标点进行切分,形成一对一的双语短句序列;短句句对齐单元,用于将从短句粗切分单元获得的一对一的双语短句序列进行句对齐,形成具有对齐关系的短句句对齐语料;最小对齐块合并单元,用于将短句句对齐单元处理过的短句句对齐语料进行最小对齐块合并,成为一对一的对齐语料;短句切分训练单元,用于利用一对一短句句对齐语料来训练短句切分模型,使用训练后的短句切分模型对输入的整句进行短句切分。 |
