一种运营商网关数据的预处理方法及系统
基本信息
申请号 | CN201710245857.3 | 申请日 | - |
公开(公告)号 | CN107590169B | 公开(公告)日 | 2020-03-06 |
申请公布号 | CN107590169B | 申请公布日 | 2020-03-06 |
分类号 | G06F16/25;G06F16/903;H04L29/08 | 分类 | 计算;推算;计数; |
发明人 | 骆宗伟;韩帅;李斌;刘金群;王博仁;陈圣铎;周兴友;杨谦 | 申请(专利权)人 | 深圳市傲天科技股份有限公司 |
代理机构 | 深圳中一专利商标事务所 | 代理人 | 南方科技大学;深圳市傲天科技股份有限公司 |
地址 | 518055 广东省深圳市南山区西丽学苑大道1088号 | ||
法律状态 | - |
摘要
摘要 | 本发明属于数据处理技术领域,提出一种运营商网关数据的预处理方法及系统。所述预处理方法包括:获取运营商网关的日志数据;根据预设的过滤规则对所述日志数据进行过滤;利用正则表达式从过滤后的日志数据中提取出包含用户搜索关键词字段的目标数据集;对所述目标数据集进行结构化处理,得到结构化的目标数据集;将所述结构化的目标数据集中的关键词字段与预设的目标字符串进行匹配,根据匹配结果以及所述目标数据集对应的用户信息确定所述目标字符串对应的目标用户,所述用户信息为所述目标数据集中用于确定用户身份的信息。与传统的数据预处理方法相比,本发明提出的数据预处理方法对运营商网关服务器的日志数据的处理效果获得大幅提升。 |
