一种失信用户数据的处理方法、系统及相关装置

基本信息

申请号 CN201710881910.9 申请日 -
公开(公告)号 CN107798068A 公开(公告)日 2018-03-13
申请公布号 CN107798068A 申请公布日 2018-03-13
分类号 G06F17/30 分类 计算;推算;计数;
发明人 肖宇涵;王黎 申请(专利权)人 浙江极赢信息技术有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 浙江极赢信息技术有限公司
地址 311121 浙江省杭州市余杭区仓前街道景兴路999号10幢210室
法律状态 -

摘要

摘要 本申请公开了一种失信用户数据的处理方法,包括:利用网络爬虫从各公共失信数据库或黑名单数据库中爬取失信数据;根据失信数据的记录形式选取相应方式进行关键词信息的提取,得到处理后关键词;将各处理后关键词按所属用户进行对应内容数据的归属划分,得到目标失信数据,并利用其建立失信用户信息库;判断失信用户信息库中否出现内容数据异常,若出现则按照各处理后关键词的优先级顺序对异常内容数据进行修正。能够通过多渠道爬取相关数据,且数据处理方式更合理和方便快捷,对数据进行比对和处理使得失信用户数据质量更高。本申请还同时公开了一种失信用户数据的处理系统、装置以及计算机可读存储介质,具有上述有益效果。