一种分词结果选择方法和装置
基本信息
申请号 | CN201611228812.7 | 申请日 | - |
公开(公告)号 | CN106777250A | 公开(公告)日 | 2017-05-31 |
申请公布号 | CN106777250A | 申请公布日 | 2017-05-31 |
分类号 | G06F17/30(2006.01)I;G06F17/27(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 陈亚堂;姬晨;张淑燕 | 申请(专利权)人 | 广州市交互式信息网络有限公司 |
代理机构 | 北京派特恩知识产权代理有限公司 | 代理人 | 王花丽;蒋雅洁 |
地址 | 518000 广东省深圳市南山区高新区北环大道9018号大族创新大厦A区6-8层、10-11层、B区6层、C区6-10层 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例公开了一种分词结果选择方法和装置,该方法包括:获取测试数据,所述测试数据包括:至少一个分词序列;通过测试模型分别对所述至少一个分词序列中的每一个分词序列进行测试,获得与所述至少一个分词序列对应的至少一个测试分值,一个分词序列对应一个测试分值;确定所述至少一个测试分值中最大分值对应的分词序列为最优分词序列;将所述最优分词序列输出至搜索引擎,以使得所述搜索引擎根据所述最优分词序列建立索引。本发明实施例通过选择分词结果中的最优分词序列建立搜索引擎的索引,提高了搜索结果的准确率。 |
