一种流式数据处理方法和系统

基本信息

申请号 CN201810889376.0 申请日 -
公开(公告)号 CN109213793A 公开(公告)日 2019-01-15
申请公布号 CN109213793A 申请公布日 2019-01-15
分类号 G06F16/2455;G06F16/2458 分类 计算;推算;计数;
发明人 左梅兰;郭子森 申请(专利权)人 泾县麦蓝网络技术服务有限公司
代理机构 北京国昊天诚知识产权代理有限公司 代理人 施敬勃
地址 242530 安徽省宣城市泾县泾川镇晏公社区庆丰组075号
法律状态 -

摘要

摘要 本发明公开了一种流式数据处理方法和系统,通过将电子商务中大量流式数据抽取流式数据的概要特征数据,建立多条处理线程,经合概要特征数据并成多个数据集,并且对数据预先进行预处理,降低数据维度,合理计算参考数据与其他数据之间的数据相似度值,从而确定数据集中的每个数据是否具有较好的关联度,最终确定是否保留该数据。可以使得在面对流式数据量较大且高并发访问时,系统可以及时响应请求,过滤错误数据,询问时间减少,传输性能可以得到优化。