模型训练方法、文本分段方法、摘要抽取方法及装置

基本信息

申请号 CN202110747227.2 申请日 -
公开(公告)号 CN113255319A 公开(公告)日 2021-08-13
申请公布号 CN113255319A 申请公布日 2021-08-13
分类号 G06F40/205(2020.01)I;G06F40/126(2020.01)I;G06F40/216(2020.01)I;G06F16/34(2019.01)I;G06F16/35(2019.01)I 分类 计算;推算;计数;
发明人 陈诚;黄石磊;程刚;吕少领 申请(专利权)人 深圳市北科瑞声科技股份有限公司
代理机构 深圳智汇远见知识产权代理有限公司 代理人 刘洁;牛悦涵
地址 518036广东省深圳市福田区梅林街道梅都社区中康路136号深圳新一代产业园3栋1201-6
法律状态 -

摘要

摘要 本申请涉及人工智能技术领域,揭露了一种模型训练方法,所述方法包括:获取训练数据集,对训练数据集进行预处理,得到训练特征向量集;获取预构建的文本分段模型和文本摘要抽取模型;利用训练特征向量集对文本分段模型和文本摘要抽取模型进行多轮交替训练,在每轮交替训练过程中利用文本分段模型的模型训练结果对用于训练文本摘要抽取模型的数据进行处理,以及利用文本摘要抽取模型的模型训练结果对用于训练文本分段模型的数据进行处理,得到标准文本分段模型和标准摘要抽取模型。此外,本申请还涉及一种文本分段方法、摘要抽取方法、装置、设备及存储介质。本申请可以提高训练得到的文本分段模型和摘要抽取模型的准确性。