一种多标签智能打标方法及系统
基本信息
申请号 | CN201910359702.1 | 申请日 | - |
公开(公告)号 | CN110222709A | 公开(公告)日 | 2019-09-10 |
申请公布号 | CN110222709A | 申请公布日 | 2019-09-10 |
分类号 | G06K9/62(2006.01)I; G06F16/901(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 顾玲玲; 毛顺亿; 曹羽; 段艳婷; 孙铭权; 郑天龙; 龚快快; 朱亮 | 申请(专利权)人 | 上海暖哇科技有限公司 |
代理机构 | 北京市万慧达律师事务所 | 代理人 | 上海暖哇科技有限公司 |
地址 | 200001 上海市黄浦区北京东路666号H区(东座)6楼A81室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种多标签智能打标方法及系统,属于计算机技术领域,通过在自建标准词库中检索以进行初筛,获取与任一标签关联的m个候选待匹配标准词;将任一标签与m个候选待匹配标准词一一进行相似度计算,获得任一标签与每一候选待匹配标准词的相似度;设定相似度阈值,根据相似度阈值,在候选待匹配标准词中确定与任一标签相关的n个待匹配标准词。该多标签智能打标方法及系统通过人工构建标签词典实现自建标准词库中的标准词尽可能多得找到对应的标签实现大规模多标签技术,在保证准确率的前提下提高召回率;灵活性较高,可随时增加标签;利用elaticsearch检索初筛结合相似度计算,最终得出与任一标签匹配的标准词,满足高并发的商业系统并能提高召回率。 |
