一种基于拼音相同或相似的中文文本纠错方法专利查询专利号|摘要-满商公司网

请输入想查询的关键字

查询

退出

浏览历史

清除

首页/ 杭州云嘉云计算有限公司/ 专利详情

一种基于拼音相同或相似的中文文本纠错方法

基本信息

摘要

摘要	本发明提出一种基于拼音相同或相似的中文文本纠错方法，包括以下步骤：S1，在传统ngrams语言模型基础上做调整，建立粒度为单个中文字符的中文字结构语言模型；S2，对待纠错语句进行候选处理，生成候选序列；S3，基于混淆集和MAD算法对候选序列进行检错，获得待纠错语句候选序列；S4，基于中文字结构语言模型的最大后验概率，使用双选Viterbi算法解码输出纠错结果。本发明相对于传统方法词粒度准确率较高，纠错速度较传统方法快。