一种文本多标签分类方法及系统

基本信息

申请号 CN202111057725.0 申请日 -
公开(公告)号 CN113672736A 公开(公告)日 2021-11-19
申请公布号 CN113672736A 申请公布日 2021-11-19
分类号 G06F16/35(2019.01)I;G06F40/216(2020.01)I;G06F40/242(2020.01)I;G06F40/284(2020.01)I;G06F40/289(2020.01)I;G06N20/00(2019.01)I 分类 计算;推算;计数;
发明人 王本强;谢赟;吴新野;韩欣 申请(专利权)人 上海德拓信息技术股份有限公司
代理机构 上海中外企专利代理事务所(特殊普通合伙) 代理人 孙益青
地址 200233上海市徐汇区虹漕路448号1幢9楼
法律状态 -

摘要

摘要 本发明公开了一种文本多标签分类方法及系统,方法包含:获取目标文本数据及其标注标签并处理得到文本数据及其标注标签;将文本数据进行数据增广;对增广后的文本数据及其标注标签构建深度学习模型;将待处理数据输入深度学习模型中获取待处理数据的标签数据;对标签数据进行判别处理得到待处理数据的标注标签;系统包含数据处理模块获取目标文本数据及其标注标签并处理得到文本数据及其标注标签;数据增广模块对文本数据进行数据增广;深度学习模型构建模块用于构建深度学习模型,还用于获取待处理数据并输入深度学习模型中获取待处理数据的标签数据;判别处理模块用于对标签数据进行判别得到待处理数据的标注标签。