一种基于众包的文本类数据标定任务的自动审核方法

基本信息

申请号 CN202010426618.X 申请日 -
公开(公告)号 CN111667152A 公开(公告)日 2020-09-15
申请公布号 CN111667152A 申请公布日 2020-09-15
分类号 G06Q10/06(2012.01)I 分类 计算;推算;计数;
发明人 刘端阳 申请(专利权)人 深圳莫比嗨客树莓派智能机器人有限公司
代理机构 大连至诚专利代理事务所(特殊普通合伙) 代理人 杨威;杨爽
地址 518000 广东省深圳市南山区南头街道大汪山社区南光路286号水木一方大厦1栋1504
法律状态 -

摘要

摘要 本发明提供一种基于众包的文本类数据标定任务的自动审核方法,包括:S1:确定待标定文本任务集、众包工人对待标定文本任务集的标定质量的阈值及公共待标定文本任务项;S2:定义待标定文本任务集中待标定文本任务项的标定类别,执行步骤S4;未定义待标定文本任务集中待标定文本任务项的标定类别,执行步骤S3;S3:利用公共待标定文本任务项计算标定类别;S4:根据众包工人的标定结果计算众包工人对待标定文本任务集的标定质量,并与阈值进行比较,并判断众包工人的标定结果是否审核通过;本发明自动审核众包工人对文本数据的标定结果,极大缓解审核人员对众包工人标定结果的繁重的审核工作,弥补了基于机器学习算法标定策略不适用的情况。