文本数据标注方法、装置、电子设备和存储介质
基本信息
申请号 | CN202110231196.5 | 申请日 | - |
公开(公告)号 | CN113111177A | 公开(公告)日 | 2021-07-13 |
申请公布号 | CN113111177A | 申请公布日 | 2021-07-13 |
分类号 | G06F16/35(2019.01)I;G06K9/62(2006.01)I;G06F40/289(2020.01)I;G06F40/284(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 吴雨霏 | 申请(专利权)人 | 中信百信银行股份有限公司 |
代理机构 | 北京植德律师事务所 | 代理人 | 唐华东 |
地址 | 100020北京市朝阳区安定路5号院3号楼8层 | ||
法律状态 | - |
摘要
摘要 | 本公开提供一种文本数据标注方法、装置、电子设备和存储介质,通过首先用待标注文本数据集合中每个待标注文本数据对应的文本特征向量生成待分类特征向量集合;再基于待分类特征向量集合进行聚类,得到至少一个待分类特征向量子集合;最后,对于每个待分类特征向量子集合,执行标注操作,标注操作包括基于该待分类特征向量子集合中待分类特征向量对应的待标注文本数据进行主题提取,得到与该待分类特征向量子集合对应的文本主题;将该待分类特征向量子集合中待分类特征向量对应的待标注文本数据的主题类别标注为该待分类特征向量子集合对应的文本主题,降低了数据标注的人力、物力和财力。 |
