一种基于投诉工单训练文本计算最佳标注集的方法及系统
基本信息
申请号 | CN202010114158.7 | 申请日 | - |
公开(公告)号 | CN111353291A | 公开(公告)日 | 2020-06-30 |
申请公布号 | CN111353291A | 申请公布日 | 2020-06-30 |
分类号 | G06F40/205(2020.01)I | 分类 | - |
发明人 | 刘博;雷晓宇;王福君;许金伟 | 申请(专利权)人 | 北京合力亿捷科技股份有限公司 |
代理机构 | 北京久诚知识产权代理事务所(特殊普通合伙) | 代理人 | 北京合力亿捷科技股份有限公司 |
地址 | 100081北京市海淀区中关村南大街甲12号寰太大厦18层 | ||
法律状态 | - |
摘要
摘要 | 一种基于电信行业客服投诉工单训练文本计算最佳标注集的方法,选取待标注训练样本后,S1、取样标注一个样本;S2、主动在线学习实时更新模型;S3、当标注数据达到一定数据累计阈值时,使用线下深度学习更新模型;S4、模型更新后对未标注池example做预测;S5、取确信度最低example作为待标注样例;S6、重复至步骤S1;S7、重复生成最优模型算法后,计算输出最佳待标注集;S8、对最佳标注集进行人工标注,从而无需大量标注训练样本。 |
