一种基于增量式片段预测的端到端词汇受限文本生成方法

基本信息

申请号 CN202210148591.1 申请日 -
公开(公告)号 CN114282515A 公开(公告)日 2022-04-05
申请公布号 CN114282515A 申请公布日 2022-04-05
分类号 G06F40/20(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 杨麟儿;聂锦燃;刘鑫;孔存良;杨尔弘;黄轩成;刘洋 申请(专利权)人 北京语言大学
代理机构 北京市广友专利事务所有限责任公司 代理人 张仲波;邓琳
地址 100083北京市海淀区学院路15号
法律状态 -

摘要

摘要 本发明公开了一种基于增量式片段预测的端到端词汇受限文本生成方法,所述方法包括:构建训练数据集,所述训练数据集中包含给定的单个或多个受限词汇和包含所述受限词汇的文本,所述受限词汇也称为关键词;构建词汇受限文本生成模型,用于对给定的关键词生成包含所述关键词的文本;使用所述训练数据集对所述词汇受限文本生成模型进行训练;将训练后的词汇受限文本生成模型应用于给定的任意关键词,生成包含所有给定的任意关键词的文本。本发明具有逻辑清晰、效率高、准确率高的优点,妥善解决了现有端到端词汇受限文本生成技术无法保证包含所有关键词的技术问题。