一种基于投诉工单训练文本计算最佳标注集的方法及系统

基本信息

申请号 CN202010114158.7 申请日 -
公开(公告)号 CN111353291A 公开(公告)日 2020-06-30
申请公布号 CN111353291A 申请公布日 2020-06-30
分类号 G06F40/205(2020.01)I 分类 -
发明人 刘博;雷晓宇;王福君;许金伟 申请(专利权)人 北京合力亿捷科技股份有限公司
代理机构 北京久诚知识产权代理事务所(特殊普通合伙) 代理人 北京合力亿捷科技股份有限公司
地址 100081北京市海淀区中关村南大街甲12号寰太大厦18层
法律状态 -

摘要

摘要 一种基于电信行业客服投诉工单训练文本计算最佳标注集的方法,选取待标注训练样本后,S1、取样标注一个样本;S2、主动在线学习实时更新模型;S3、当标注数据达到一定数据累计阈值时,使用线下深度学习更新模型;S4、模型更新后对未标注池example做预测;S5、取确信度最低example作为待标注样例;S6、重复至步骤S1;S7、重复生成最优模型算法后,计算输出最佳待标注集;S8、对最佳标注集进行人工标注,从而无需大量标注训练样本。