语言模型预训练方法、装置

基本信息

申请号 CN202110683642.6 申请日 -
公开(公告)号 CN113408619A 公开(公告)日 2021-09-17
申请公布号 CN113408619A 申请公布日 2021-09-17
分类号 G06K9/62(2006.01)I;G06F40/289(2020.01)I;G06F40/295(2020.01)I;G06N3/04(2006.01)I 分类 计算;推算;计数;
发明人 陈桂兴;黄羿衡 申请(专利权)人 江苏苏云信息科技有限公司
代理机构 江苏坤象律师事务所 代理人 赵新民
地址 215012江苏省苏州市苏州吴中经济开发区越溪街道吴中大道1421号太湖软件产业园智慧谷园区6号楼4楼402室
法律状态 -

摘要

摘要 本发明提供语言模型预训练方法,包括:获取基于第一特征初始化的第一词向量,所述第一特征包括图像特征;获取随机初始化的第二词向量;基于所述第一词向量与所述第二词向量训练语言模型。结合了包括图像和词语构成的多模态特征进行预训练,提升了语言与现实事物的关联性;降低了进行语言模型预训练所需的语料,有效利用了外部知识,有利于进一步提高语言模型在下游任务中的使用效果。本发明还提供的语言模型预训练装置能够实现本发明的语言模型预训练方法而具有相应优势。