多模型训练方法、摘要分段方法、文本分段方法及装置

基本信息

申请号 CN202110762240.5 申请日 -
公开(公告)号 CN113204956A 公开(公告)日 2021-08-03
申请公布号 CN113204956A 申请公布日 2021-08-03
分类号 G06F40/205(2020.01)I;G06F40/126(2020.01)I;G06F40/216(2020.01)I;G06F16/34(2019.01)I;G06F16/35(2019.01)I 分类 计算;推算;计数;
发明人 蒋志燕;吕少领;黄石磊;程刚 申请(专利权)人 深圳市北科瑞声科技股份有限公司
代理机构 深圳智汇远见知识产权代理有限公司 代理人 刘洁;牛悦涵
地址 518036广东省深圳市福田区梅林街道梅都社区中康路136号深圳新一代产业园3栋1201-6
法律状态 -

摘要

摘要 本申请涉及人工智能技术领域,揭露了一种多模型训练方法,所述方法包括:将训练文本集中文本划分为单句,得到训练单句集;对训练单句集进行特征提取,得到训练单句向量集;提取训练单句向量集中训练单句的段落编码特征以及摘要编码特征;利用训练单句向量集和摘要编码特征对预构建的文本分段模型进行第一训练,以及利用训练单句向量集和段落编码特征对预构建的文本摘要抽取模型进行第二训练,得到标准文本分段模型和标准文本摘要抽取模型。此外,本申请还涉及一种摘要抽取方法、文本分段方法、装置、设备及存储介质。本申请可以提高训练得到的文本分段模型和摘要抽取模型的模型准确性,以及获取训练得到的文本分段模型和摘要抽取模型的获取效率。