离散数据采集分析系统及方法
基本信息
申请号 | CN201811045808.6 | 申请日 | - |
公开(公告)号 | CN109241432A | 公开(公告)日 | 2019-01-18 |
申请公布号 | CN109241432A | 申请公布日 | 2019-01-18 |
分类号 | G06F16/9535;G06F16/215;G06F16/28;G06F16/248 | 分类 | 计算;推算;计数; |
发明人 | 杨率;付乐爽 | 申请(专利权)人 | 云南东巴文信息技术有限公司 |
代理机构 | 昆明祥和知识产权代理有限公司 | 代理人 | 云南东巴文信息技术有限公司 |
地址 | 650000 云南省昆明市五华区高新区新发村鼎易天城8幢第21层 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种离散数据采集分析系统及方法,包括:数据采集模块用于实时多维度地采集离散的数据,数据包括网页媒体文本数据、网络爬虫抓取的互联网数据、Hadoop数据、服务器运行日志数据及可以接入其他业务系统的数据;数据分析模块用于对采集到的该些数据进行数据解析和数据清洗;数据存储模块用于通过倒排索引方式存储经数据清洗后的数据,并建立数据中分词与所处文档之间的映射关系;数据检索模块用于对输入的检索词进行分析,提取关键词,并从数据存储模块中抓取出检索词对应的目标数据;数据可视化模块用于根据检索词对目标数据进行打分排序,以拓扑图展现数据相关性。本发明数据采集渠道多,检索更高效更精确。 |
