一种基于众包的分词标注质量评估系统及评估方法

基本信息

申请号 CN201811648856.4 申请日 -
公开(公告)号 CN109670727A 公开(公告)日 2019-04-23
申请公布号 CN109670727A 申请公布日 2019-04-23
分类号 G06Q10/06(2012.01)I; G06Q10/10(2012.01)I; G06F17/27(2006.01)I 分类 计算;推算;计数;
发明人 邹远强; 王黎明; 刘理; 俞笛 申请(专利权)人 湖南网数科技有限公司
代理机构 长沙新裕知识产权代理有限公司 代理人 湖南网数科技有限公司
地址 410006 湖南省长沙市岳麓区岳麓科技产业园学士路8号长沙含浦科教产业园开发建设有限公司综合服务楼6018室
法律状态 -

摘要

摘要 本发明涉及一种基于众包的分词标注质量评估系统及评估方法,涉及医学文本自然语言处理、知识众包算法,属于自然语言处理、众包和互联网应用领域。包括语料处理模块,用于对语料数据进行数据预处理,形成标准的语料文本;任务管理模块用于生成和管理众包任务;用户管理模块用于用户、角色和权限的管理和控制;资源标注模块用于给用户提供交互友好的可视化界面,供用户进行语料标注操作;质量控制模块是本发明装置的核心模块,包含黄金数据集权重计算、用户贡献度计算、综合任务评分等,是整个众包任务质量控制的关键。本发明设计的目的在于提供一种基于众包的分词标注质量评估装置,通过质量控制模块提供的算法提高分词标注众包的质量,提高自然语言处理效率和准确率。