基于翻译的专业垂直领域文本同义改写方法

基本信息

申请号 CN202011449188.X 申请日 -
公开(公告)号 CN112560509A 公开(公告)日 2021-03-26
申请公布号 CN112560509A 申请公布日 2021-03-26
分类号 G06N3/08(2006.01)I;G06F40/58(2020.01)I;G06N3/04(2006.01)I;G06F40/45(2020.01)I;G06F40/242(2020.01)I 分类 计算;推算;计数;
发明人 王征;罗学优 申请(专利权)人 杭州艾耕科技有限公司
代理机构 杭州天昊专利代理事务所(特殊普通合伙) 代理人 何碧珩;卓彩霞
地址 310052浙江省杭州市滨江区六和路368号一幢(北)三楼D3052室
法律状态 -

摘要

摘要 本发明公开了一种基于翻译的专业垂直领域文本同义改写方法,包括以下步骤:输入待改写文本;确定垂直领域专有名词,并选择规避词汇;将待改写文本的中文翻译成英文,并加入专有名词;将英文翻译成中文,使翻译结果中不出现规避词汇;输出改写结果。本发明在输入端提供垂直领域的专有名词信息,优化了文本改写过程中专有名词的保持能力,使得垂直领域的相关文本改写结果质量更佳。在生成文本时,采取特定的解码策略,使得本发明能提供不同改写幅度的结果,满足了不同的场景下的改写幅度需求,提高了灵活性。同时,本发明所采用的解码策略也能够提供具有随机性的多种改写结果,具备更强的多样性。