一种基于自我学习算法的数据标注方法及装置
基本信息
申请号 | CN201910237084.3 | 申请日 | - |
公开(公告)号 | CN109830230B | 公开(公告)日 | 2019-05-31 |
申请公布号 | CN109830230B | 申请公布日 | 2019-05-31 |
分类号 | G10L15/06(2013.01)I | 分类 | - |
发明人 | 余伟;赵静芝;任丽;胡发泽;徐旭东 | 申请(专利权)人 | 深圳平安综合金融服务有限公司上海分公司 |
代理机构 | 上海专利商标事务所有限公司 | 代理人 | 深圳平安综合金融服务有限公司上海分公司 |
地址 | 200040上海市静安区常熟路8号静安广场8幢裙房4层L单元 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及语音信号处理领域,更具体的说,涉及一种基于自我学习算法的数据标注方法及装置。该方法包括:语音识别步骤;文本对比步骤,将多篇识别文本进行对比,标注差异部分文本,并进行断句处理;自然语言处理算法评价步骤;自然语言处理算法预测步骤;数据标注步骤,参考差异部分原始识别文本与预测文本,对最优预标注文本进行多次数据标注,形成多组数据标注文本;质检步骤;自我学习步骤,将最优标注文本与对应音频信号输入语音识别引擎,语音识别引擎基于自我学习算法迭代训练语音识别。本发明方法及装置,大大节省了数据标注时长,有效提升了数据标注质量和数据标注效率,为各类人工智能产品提供训练支持,提升智能产品生产效果。 |
