一种多人语音分离方法及语音分离模型的训练方法专利查询专利号|摘要-满商公司网

一种多人语音分离方法及语音分离模型的训练方法

基本信息

摘要

摘要	本发明公开了一种多人语音分离方法及语音分离模型的训练方法，分离方法包括以下步骤：将混合语音数据输入编码器处理以输出三维的特征张量；对特征张量进行组归一化处理、卷积操作和分段处理，将其结果输入到自注意力块中处理，以对其进行分离函数映射，再经过第一激活函数处理、卷积操作后进行重叠操作，对其结果进行卷积操作后分别经过第二激活函数和第三激活函数的处理，以得到两个特征张量，作乘积运算后进行卷积和第四激活函数处理，并与编码器的输出进行乘积操作，以分离出不同说话人的特征数据。本发明提供的多人语音分离方法及语音分离模型的训练方法不依赖时序关系，能够很容易地进行并行计算，提升模型的训练效率。