一种结合多头自注意力机制的CNN文本分类方法
基本信息

| 申请号 | CN202010040278.7 | 申请日 | - |
| 公开(公告)号 | CN111259666A | 公开(公告)日 | 2020-06-09 |
| 申请公布号 | CN111259666A | 申请公布日 | 2020-06-09 |
| 分类号 | G06F40/289(2020.01)I | 分类 | 计算;推算;计数; |
| 发明人 | 刘星辰;陈晓峰;麻沁甜 | 申请(专利权)人 | 上海勃池信息技术有限公司 |
| 代理机构 | 上海领洋专利代理事务所(普通合伙) | 代理人 | 上海勃池信息技术有限公司 |
| 地址 | 200000上海市嘉定区汇源路55号8幢5层517室 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明公开一种结合多头自注意力机制的CNN文本分类方法,包括:获取待分类文本的分词序列,并进行特殊符号和停止词过滤等预处理;查询预设或随机初始化的词嵌入模型获取分词序列的嵌入矩阵,矩阵的每一行为各分词的嵌入向量;针对所得嵌入矩阵的各行向量,叠加该向量对应分词的位置编码向量;对叠加位置编码后的嵌入矩阵通过自注意力机制生成自注意力矩阵;重复若干次自注意力矩阵的生成,将生成的多个矩阵在列的维度上进行拼接;将词序列拼接后的自注意力矩阵与加权矩阵相乘,实现降维和融合;将降维和融合后的自注意力矩阵输入CNN,进行训练或者预测。 |





