结合分类算法与非监督算法的文本质量控制方法及系统

基本信息

申请号 CN202011578227.6 申请日 -
公开(公告)号 CN112650837A 公开(公告)日 2021-04-13
申请公布号 CN112650837A 申请公布日 2021-04-13
分类号 G06F16/33;G06F16/35;G06F40/284 分类 计算;推算;计数;
发明人 吴明平 申请(专利权)人 上海风秩科技有限公司
代理机构 青岛清泰联信知识产权代理有限公司 代理人 赵燕
地址 200232 上海市徐汇区龙兰路277号2号楼5楼5B04单元
法律状态 -

摘要

摘要 本申请公开了一种结合分类算法与非监督算法的文本质量控制方法及系统,所述方法包括:收集文本数据;过滤所述文本数据中的无关数据,获取过滤文本;删除所述过滤文本中的通用噪声数据,获取去噪文本;删除所述去噪文本中的标题党数据,并输出文本质量分。通过本申请,可控制文本质量,同时输出文本质量分。