一种语言模型训练方法、汉语拼音输入方法及装置专利查询专利号|摘要-满商公司网

一种语言模型训练方法、汉语拼音输入方法及装置

基本信息

摘要

摘要	本申请实施例提供了一种语言模型训练方法及装置，该语言模型包括编码器和解码器。该方法包括：获取训练数据，训练数据包括成对的拼音编码序列和汉字编码序列，拼音序列包含多个拼音编码，每个拼音编码对应一个音节，汉字编码序列包含多个汉字编码，每个汉字编码对应一个汉字；以拼音编码序列作为编码器的输入，输出拼音编码序列的全局上下文特征和音节发音特征；以编码器输出的全局上下文特征和音节发音特征以及前序汉字编码序列作为解码器的输入，以汉字编码序列为解码器的目标输出，训练语言模型。从而，将该语言模型应用到输入法中，能够使输入法具备准确的整句输入能力，从而解决了现有技术的汉语拼音输入方法整句输入准确性差的问题。