一种适用于神经网络机器翻译的汉语分词方法及装置

基本信息

申请号 CN201911028104.2 申请日 -
公开(公告)号 CN110852099B 公开(公告)日 2021-10-29
申请公布号 CN110852099B 申请公布日 2021-10-29
分类号 G06F40/289(2020.01)I;G06F40/216(2020.01)I;G06F40/58(2020.01)I 分类 计算;推算;计数;
发明人 张孝飞;葛昱晖;陈莉莉;李帅;吕荣波 申请(专利权)人 北京中献电子技术开发有限公司
代理机构 中科专利商标代理有限责任公司 代理人 鄢功军
地址 100081北京市海淀区气象路50号中知大厦
法律状态 -

摘要

摘要 本发明涉及机器翻译技术领域,尤其涉及一种适用于神经网络机器翻译的汉语分词方法及装置;所述分词方法包括以下步骤:S100:对传统分词词表进行处理,形成适用于神经网络机器翻译的新分词词表;S200:依照新分词词表,对句子进行分词,采用前向最大匹配法和后向最大匹配法结合的方式,分别进行分词;S300:将前向最大匹配法的分词结果和后向最大匹配法的分词结果进行比较,进行评价处理后择一输出,该方法降低了待译文本的数据维度,提高了神经网络机器翻译的效率和准确性。