大数据知识挖掘及精准跟踪方法与系统
基本信息
申请号 | CN201710470156.X | 申请日 | - |
公开(公告)号 | CN108228687A | 公开(公告)日 | 2018-06-29 |
申请公布号 | CN108228687A | 申请公布日 | 2018-06-29 |
分类号 | G06F17/30;G06F17/27;G06K9/62 | 分类 | 计算;推算;计数; |
发明人 | 刘志阳;王玲;孙喆;杨赵磊;毛婷婷;李江龙 | 申请(专利权)人 | 上海吉贝克信息技术有限公司 |
代理机构 | 上海光华专利事务所(普通合伙) | 代理人 | 上海吉贝克信息技术有限公司 |
地址 | 200093 上海市杨浦区控江七村61号172幢237室 | ||
法律状态 | - |
摘要
摘要 | 本发明的大数据知识挖掘及精准跟踪方法与系统,通过判断是否已有正确分类的训练语料从而区分监督分类和非监督分类,对应监督分类进行第一处理,包括根据预处理的训练样本提取特征,并生成特征向量,从而训练分类器来对待分类样本进行分类;或者,对应非监督分类采用对待分类样本进行预处理及特征提取,并生成特征向量,然后进行特征向量间相似度运算,再通过聚类算法完成对待分类样本的分类;使用多种分类算法的嵌套来实现多层级的多分类问题,同时需要将交互的关键词加入到特征集合中,并根据相应的算法赋予一定的特征权重将其应用到分类算法中,最终提高自动分类的准确性。 |
