一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法

基本信息

申请号 CN202010850491.4 申请日 -
公开(公告)号 CN111984707A 公开(公告)日 2020-11-24
申请公布号 CN111984707A 申请公布日 2020-11-24
分类号 G06F16/2458(2019.01)I 分类 计算;推算;计数;
发明人 刘朝;王东强;谢晶晶;孙英刚;欧燕林;夏扬;吴成军;申东阳;李国勇 申请(专利权)人 重庆大数据研究院有限公司
代理机构 重庆信航知识产权代理有限公司 代理人 穆祥维
地址 401147重庆市渝北区北部新区杨柳路2号综合研发楼
法律状态 -

摘要

摘要 本发明公开了一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,包括如下步骤;S1、收集车辆多模式跨界大数据的原始数据集;S2、对收集到的所述原始数据集进行数据预处理;S3、对预处理后的数据利用WEKA算法进行数据挖掘提取出特征关键字;S4、通过TF‑IDF技术计算出特征关键字权重和不同特征关键字之间的相似度,构建权重和相似度矩阵;S5、基于样本构建回归模型。本发明通过t‑SNE降维、WEKA算法特征提取和TF‑IDF算法,针对高维数据采取先降维再提取特征的分析策略,不仅实现了跨界大数据多层次深度融合挖掘的有效融合,解决了由数据类型复杂、数据特征众多的高维数据集造成的融合效率低下和工作效率没有显著提高的问题。