数据标注方法、装置、电子设备及计算机可读存储介质
基本信息
申请号 | CN202110647704.8 | 申请日 | - |
公开(公告)号 | CN113239205A | 公开(公告)日 | 2021-08-10 |
申请公布号 | CN113239205A | 申请公布日 | 2021-08-10 |
分类号 | G06F16/35(2019.01)I;G06F16/45(2019.01)I;G06F40/30(2020.01)I;G06F16/215(2019.01)N;G06F16/25(2019.01)N | 分类 | 计算;推算;计数; |
发明人 | 史祎凡;杜新凯;吕超;蔡岩松 | 申请(专利权)人 | 阳光保险集团股份有限公司 |
代理机构 | 北京超凡宏宇专利代理事务所(特殊普通合伙) | 代理人 | 余菲 |
地址 | 518000广东省深圳市福田区红荔西路7002号第一世界广场A座17层 | ||
法律状态 | - |
摘要
摘要 | 本申请提供了一种数据标注方法、装置、电子设备及计算机可读存储介质,该方法包括:获取包含有至少一个文本数据及文本数据对应的第一标注结果的第一数据集;当第一标注结果的准确率大于第一阈值时,对第一数据集中的文本数据进行数据扩充得到第二数据集;针对第二数据集中的每个文本数据,从该文本数据中提取出与预设的维护词表中的关键词相同的目标词语,确定第二标注结果;当第二标注结果的准确率大于第二阈值时,将每个文本数据对应的第一标注结果和第二标注结果的树状关系确定为该文本数据的目标标注结果。本申请通过对文本数据标注第一标注结果和第二标注结果,并根据第一标注结果与第二标注结之间的树状关系,提高文本数据的区分度。 |
