一种文本归类方法

基本信息

申请号 CN202010485064.0 申请日 -
公开(公告)号 CN111625650A 公开(公告)日 2020-09-04
申请公布号 CN111625650A 申请公布日 2020-09-04
分类号 G06F16/35(2019.01)I 分类 计算;推算;计数;
发明人 仪强 申请(专利权)人 领猎网络科技(上海)有限公司
代理机构 北京世誉鑫诚专利代理事务所(普通合伙) 代理人 领猎网络科技(上海)有限公司
地址 200000上海市崇明区崇明县城桥镇秀山路8号3幢四层N区2019室(上海市崇明工业园区)
法律状态 -

摘要

摘要 本发明公开的文本归类方法,涉及文本处理技术领域,通过检测待归类的文本是否符合预设的规范标准,若是,则将文本输入训练过的LDA模型,得到文本表达的主题并判断文本表达的主题是否命中预设的多个主题,若是,则对文本进行预处理并将预处理之后的文本分别输入多个训练过的文本归类模型,得到文本表达的主题的归类结果集合,分别对归类结果集合中的同一类归类结果做加权平均处理,得到各类归类结果最终的概率,将数值最大的概率对应的归类结果作为文本最终的归类结果,提高了效率和精确度,可扩展性较强。