一种文本匹配的方法、装置及终端

基本信息

申请号 CN201811308423.4 申请日 -
公开(公告)号 CN109299471A 公开(公告)日 2019-02-01
申请公布号 CN109299471A 申请公布日 2019-02-01
分类号 G06F17/27;G06F16/30 分类 计算;推算;计数;
发明人 吴朋书;许晓平;洪湧明 申请(专利权)人 广州百田信息科技有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 广州百田信息科技有限公司
地址 510520 广东省广州市天河区高普路1023号5233室
法律状态 -

摘要

摘要 本申请公开了一种文本匹配的方法、装置及终端,涉及语音识别技术领域,该方法包括:将获取的语音识别文本以及预设备选项文本转化为对应的拼音字符串;利用字符拆分规则对各拼音字符串进行拆分,得到语音识别文本字符单元组和各预设备选项文本字符单元组;分别计算语音识别文本字符单元组与各预设备选项文本字符单元组之间相同字符单元出现的频次;若频次中的最大频次值大于设定匹配阈值时,将最大频次值对应的预设备选项文本作为匹配文本。该方法很大程度还原了语音识别文本中包含的发音者原来的读音信息,对语音识别设备的识别错误情况有极高的意图还原能力,容错性高,进而提升了后续文本匹配的准确性和匹配效率。