面向神经网络机器翻译的日语动词识别、词性标注方法
基本信息

| 申请号 | CN201911028262.8 | 申请日 | - |
| 公开(公告)号 | CN110781667B | 公开(公告)日 | 2021-10-08 |
| 申请公布号 | CN110781667B | 申请公布日 | 2021-10-08 |
| 分类号 | G06F40/253;G06F40/30;G06F40/58;G06N3/04;G06N3/08 | 分类 | 计算;推算;计数; |
| 发明人 | 张孝飞;诸敏刚;葛昱晖;陈莉莉;周聪 | 申请(专利权)人 | 北京中献电子技术开发有限公司 |
| 代理机构 | 中科专利商标代理有限责任公司 | 代理人 | 鄢功军 |
| 地址 | 100081 北京市海淀区气象路50号中知大厦 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明涉及机器翻译技术领域,尤其涉及一种面向神经网络机器翻译的日语动词识别、词性标注方法及系统。该方法包括以下步骤:S100、删除日语文本中的左邻接标志和结尾标志的特殊词汇;S200、查找选取得到候选动词;S300、切分得到待还原候选动词,对候选动词进行还原,若验证其正确,则该候选动词还原成功;S400、对还原成功的动词及其变形词尾进行切分,标注词性及其语法意义。本发明通过加入二次判断机制及完善复合动词的识别处理规则,提高了动词识别的准确度;同时对动词及其变形词尾进行词干、词尾、可能表现、时、态、情态的切分,有效提高了词法分析的准确性,从而有效提升了译文质量。 |





