一种卷积自编码器及基于该编码器的词嵌入向量压缩方法
基本信息

| 申请号 | CN202010036928.0 | 申请日 | - |
| 公开(公告)号 | CN111507100A | 公开(公告)日 | 2020-08-07 |
| 申请公布号 | CN111507100A | 申请公布日 | 2020-08-07 |
| 分类号 | G06F40/289;G06N3/04;G06N3/08;G06F16/33;G06F16/35;G06F40/58 | 分类 | - |
| 发明人 | 刘星辰;陈晓峰;麻沁甜 | 申请(专利权)人 | 上海勃池信息技术有限公司 |
| 代理机构 | 上海骁象知识产权代理有限公司 | 代理人 | 上海勃池信息技术有限公司 |
| 地址 | 201815 上海市嘉定区汇源路55号8幢5层517室 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明公开了一种卷积自编码器,包括:编码层,用于将输入卷积自编码器的向量进行卷积编码,并表示为中间层特征图;解码层,用于将编码层输出的中间层特征图反卷积重构,并输出重构后的重构向量。编码层对输入的向量进行卷积。本发明提供了一种卷积自编码器,能够进行无监督训练,同时对卷积自编码器的中间层特征图及重构向量进行对比计算,直到二者之间没有误差,防止数据出现错误。基于卷积自编码器的词嵌入向量进行压缩方法,对卷积自编码器输出的中间层特征图最大化处理,能够对词嵌入向量进行压缩,可以将对词嵌入向量与多个嵌入模型融合,并获得较低维度的词嵌入向量,从而显著降低计算机的计算量。 |





