深度学习语言模型的词图重打分方法和系统

基本信息

申请号 CN201810054749.2 申请日 -
公开(公告)号 CN108415898A 公开(公告)日 2018-08-17
申请公布号 CN108415898A 申请公布日 2018-08-17
分类号 G06F17/27;G06F17/30 分类 计算;推算;计数;
发明人 俞凯;李豪;陈哲怀;游永彬 申请(专利权)人 上海交大知识产权管理有限公司
代理机构 北京商专永信知识产权代理事务所(普通合伙) 代理人 苏州思必驰信息科技有限公司;上海交通大学;上海交大知识产权管理有限公司
地址 215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
法律状态 -

摘要

摘要 本发明公开用于智能对话语音平台的深度学习语言模型的词图重打分方法、系统和电子设备,方法包括:在词图的每一条边或各节点上存储一个输出词;自词图的开始节点按序遍历词图的各节点和每一条边,记录自开始节点到各第i节点经过的ki条路径,并将每条路径上的所有边或所有节点上的输出词串联,以形成ki个词序列;将ki个词序列进行缩减处理,形成ji个词序列;调用深度学习语言模型计算各第i节点的ji个词序列的分数。本发明采用词图作为重打分的目标,解决搜索空间小的问题,用历史缓存解决冗余重复计算的问题,用历史聚类、令牌剪枝、集束剪枝减少词图的扩展,加快计算,减少内存消耗,采用节点并行化计算,加速词图重打分效率。