一种基于seq2seq网络的歌词对齐方法及系统专利查询专利号|摘要-满商公司网

一种基于seq2seq网络的歌词对齐方法及系统

基本信息

摘要

摘要	本发明公开了一种基于seq2seq网络的歌词对齐方法及系统，方法包括：对歌词进行处理得到歌词向量，对音频进行处理得到起止时间与歌词对应的人声频谱图；采用seq2seq网络模型对歌词向量和对应的频谱图进行处理，得到输入歌词的注意力矩阵；将注意力矩阵整合解析为字符级别的对齐结果，得到歌词每个字的开始时间和结束时间。系统包括数据处理模块对歌词进行处理得到歌词向量，对音频进行处理得到起止时间与歌词对应的人声频谱图；数据预测模块采用网络模型对歌词向量和对应的频谱图进行处理，得到输入歌词的注意力矩阵；对齐结果解析模块用于将注意力矩阵整合解析为字符级别的对齐结果，得到歌词每个字的开始时间和结束时间。