基于Bert模型的文本中句子生成方法和装置

基本信息

申请号 CN202210325354.8 申请日 -
公开(公告)号 CN114692571A 公开(公告)日 2022-07-01
申请公布号 CN114692571A 申请公布日 2022-07-01
分类号 G06F40/126(2020.01)I;G06F40/216(2020.01)I;G06F40/289(2020.01)I;G06K9/62(2022.01)I 分类 计算;推算;计数;
发明人 陈洁松;范洪辉;朱洪锦;吴航;杨昌宇;张翔平;盛小春 申请(专利权)人 江苏理工学院
代理机构 常州佰业腾飞专利代理事务所(普通合伙) 代理人 -
地址 213001江苏省常州市中吴大道1801号
法律状态 -

摘要

摘要 本发明提供了一种基于Bert模型的文本中句子生成方法和装置,该方法包括以下步骤:在模型输入层对输入的源语句进行编码以获取输入矩阵;在Bert‑base编码层采用Bert模型对输入矩阵进行编码,叠加12层Transformer,取最后一层的输出作为Bert‑base编码层的输出;在解码端采用Transformerdecoder端的网络对Bert‑base编码层的输出进行顺序解码以生成解码端的输出;在softmax的激活层将解码端的输出映射到词表上以获取每个单词概率的输出向量;根据每个单词概率的输出向量生成相应的句子。由此,采用Bert模型能够自动生成文本中句子,从而人工提供训练数据,大大节省了人力物力资源。