一种流式数据处理方法和系统
基本信息
申请号 | CN201810889376.0 | 申请日 | - |
公开(公告)号 | CN109213793A | 公开(公告)日 | 2019-01-15 |
申请公布号 | CN109213793A | 申请公布日 | 2019-01-15 |
分类号 | G06F16/2455;G06F16/2458 | 分类 | 计算;推算;计数; |
发明人 | 左梅兰;郭子森 | 申请(专利权)人 | 泾县麦蓝网络技术服务有限公司 |
代理机构 | 北京国昊天诚知识产权代理有限公司 | 代理人 | 施敬勃 |
地址 | 242530 安徽省宣城市泾县泾川镇晏公社区庆丰组075号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种流式数据处理方法和系统,通过将电子商务中大量流式数据抽取流式数据的概要特征数据,建立多条处理线程,经合概要特征数据并成多个数据集,并且对数据预先进行预处理,降低数据维度,合理计算参考数据与其他数据之间的数据相似度值,从而确定数据集中的每个数据是否具有较好的关联度,最终确定是否保留该数据。可以使得在面对流式数据量较大且高并发访问时,系统可以及时响应请求,过滤错误数据,询问时间减少,传输性能可以得到优化。 |
