基于RM算法提升特写词语搜索精度的方法及系统

基本信息

申请号 CN201710189291.7 申请日 -
公开(公告)号 CN106951548B 公开(公告)日 2020-07-17
申请公布号 CN106951548B 申请公布日 2020-07-17
分类号 G06F16/951;G06F16/953;G06F16/9535;G06F40/284;G06F40/247 分类 -
发明人 陈刚;曾明;宋涛;李京 申请(专利权)人 聚龙融创科技有限公司
代理机构 北京律智知识产权代理有限公司 代理人 聚龙融创科技有限公司
地址 100094 北京市海淀区东北旺西路8号院23号楼三层301
法律状态 -

摘要

摘要 本公开提供了一种基于RM算法提升特写词语搜索精度的方法及系统、电子设备。该基于RM算法提升特写词语搜索精度的方法包括:根据数据采集获取的网络爬虫数据和企业内部数据构建自定义分词库;采用多种预设分词算法对接收的查询语句进行分词,获取多组分词结果;采用所述多组分词结果分别进行搜索,并计算各组的搜索得分;根据各组的搜索得分及相应的分词结果对所述自定义分词库进行修正。本发明的技术方案能够有效提高特定业务场景的分词精度和搜索准确度。