面向神经网络机器翻译的日语动词识别、词性标注方法

基本信息

申请号 CN201911028262.8 申请日 -
公开(公告)号 CN110781667B 公开(公告)日 2021-10-08
申请公布号 CN110781667B 申请公布日 2021-10-08
分类号 G06F40/253;G06F40/30;G06F40/58;G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 张孝飞;诸敏刚;葛昱晖;陈莉莉;周聪 申请(专利权)人 北京中献电子技术开发有限公司
代理机构 中科专利商标代理有限责任公司 代理人 鄢功军
地址 100081 北京市海淀区气象路50号中知大厦
法律状态 -

摘要

摘要 本发明涉及机器翻译技术领域,尤其涉及一种面向神经网络机器翻译的日语动词识别、词性标注方法及系统。该方法包括以下步骤:S100、删除日语文本中的左邻接标志和结尾标志的特殊词汇;S200、查找选取得到候选动词;S300、切分得到待还原候选动词,对候选动词进行还原,若验证其正确,则该候选动词还原成功;S400、对还原成功的动词及其变形词尾进行切分,标注词性及其语法意义。本发明通过加入二次判断机制及完善复合动词的识别处理规则,提高了动词识别的准确度;同时对动词及其变形词尾进行词干、词尾、可能表现、时、态、情态的切分,有效提高了词法分析的准确性,从而有效提升了译文质量。