短语挖掘方法及装置
基本信息
申请号 | CN201610388049.8 | 申请日 | - |
公开(公告)号 | CN107463554B | 公开(公告)日 | 2021-05-04 |
申请公布号 | CN107463554B | 申请公布日 | 2021-05-04 |
分类号 | G06F40/47;G06F40/58;G06F16/2457 | 分类 | 计算;推算;计数; |
发明人 | 卞华明;管陶然;史黎鑫;张海波;刘禹;赵宇;骆卫华;林锋 | 申请(专利权)人 | 阿里巴巴(中国)网络技术有限公司 |
代理机构 | 北京博思佳知识产权代理有限公司 | 代理人 | 李威;林祥 |
地址 | 浙江省杭州市滨江区网商路699号 | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种短语挖掘方法及装置,该方法可以包括:从原始语料中抽取候选短语集合,所述候选短语集合中包含若干候选短语;将所述候选短语集合分配至若干预设处理对象,以由所述预设处理对象根据预定义的筛选条件对被分配的候选短语进行筛选;根据所述预设处理对象返回的筛选结果,确定所述候选短语集合中满足预设质量条件的短语。通过本申请的技术方案,可以实现对高质量短语的准确挖掘。 |