一种卷积自编码器及基于该编码器的词嵌入向量压缩方法

基本信息

申请号 CN202010036928.0 申请日 -
公开(公告)号 CN111507100A 公开(公告)日 2020-08-07
申请公布号 CN111507100A 申请公布日 2020-08-07
分类号 G06F40/289;G06N3/04;G06N3/08;G06F16/33;G06F16/35;G06F40/58 分类 -
发明人 刘星辰;陈晓峰;麻沁甜 申请(专利权)人 上海勃池信息技术有限公司
代理机构 上海骁象知识产权代理有限公司 代理人 上海勃池信息技术有限公司
地址 201815 上海市嘉定区汇源路55号8幢5层517室
法律状态 -

摘要

摘要 本发明公开了一种卷积自编码器,包括:编码层,用于将输入卷积自编码器的向量进行卷积编码,并表示为中间层特征图;解码层,用于将编码层输出的中间层特征图反卷积重构,并输出重构后的重构向量。编码层对输入的向量进行卷积。本发明提供了一种卷积自编码器,能够进行无监督训练,同时对卷积自编码器的中间层特征图及重构向量进行对比计算,直到二者之间没有误差,防止数据出现错误。基于卷积自编码器的词嵌入向量进行压缩方法,对卷积自编码器输出的中间层特征图最大化处理,能够对词嵌入向量进行压缩,可以将对词嵌入向量与多个嵌入模型融合,并获得较低维度的词嵌入向量,从而显著降低计算机的计算量。