对话数据增广方法、电子设备和存储介质

基本信息

申请号 CN202210180886.7 申请日 -
公开(公告)号 CN114547271A 公开(公告)日 2022-05-27
申请公布号 CN114547271A 申请公布日 2022-05-27
分类号 G06F16/332(2019.01)I;G06K9/62(2022.01)I 分类 计算;推算;计数;
发明人 郑楚杰;黄民烈 申请(专利权)人 北京智源人工智能研究院
代理机构 北京辰权知识产权代理有限公司 代理人 -
地址 100084北京市海淀区中关村东路1号院8号楼三层B201D-1
法律状态 -

摘要

摘要 本申请公开了一种对话数据增广方法、电子设备及存储介质。该对话数据增广方法,包括:获取对话模板提示信息;调用参数规模大于参数量阈值的预训练语言模型,应用该预训练语言模型基于所述对话模板提示信息独立进行对话数据增广处理。本申请的对话数据增广方法能够有效提高开放端对话数据的增广效率,降低增广过程的复杂程度,提高开放端对话数据的增广规模及泛化能力,进而能够提高基于增广后的对话数据进行模型训练的有效性及可靠性。