一种基于双层知识蒸馏说话人模型压缩系统和方法
基本信息
申请号 | CN202011079752.3 | 申请日 | - |
公开(公告)号 | CN112712099A | 公开(公告)日 | 2021-04-27 |
申请公布号 | CN112712099A | 申请公布日 | 2021-04-27 |
分类号 | G06K9/62;G10L15/22 | 分类 | 计算;推算;计数; |
发明人 | 李入云;宋丹丹;欧阳鹏;尹首一 | 申请(专利权)人 | 江苏清微智能科技有限公司 |
代理机构 | 北京索睿邦知识产权代理有限公司 | 代理人 | 李根 |
地址 | 211100 江苏省南京市江宁区麒麟科技创新园创研路266号人工智能产业园8号楼3层 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种基于双层知识蒸馏说话人模型压缩系统和方法,属于立体匹配算法的实现方式技术领域。包括:Embedding层知识蒸馏指导学生网络模仿教师网络的段级说话人表示(说话人表征),它捕获了每个说话人特征的基本分布。Logit层知识蒸馏引导学生网络模仿教师网络的说话人后验概率分布,利用了说话人类别之间的相似性。此方法从教师网络那里迁移了说话人表征分布的层次结构。本发明解决了现有技术中学生网络不能实现较小的说话人类内差异和较大的说话人类间差异,且相同说话人和不同说话人验证系统的准确性较低的问题。 |
