数据预处理方法、装置、设备及介质

基本信息

申请号 CN201910872305.4 申请日 -
公开(公告)号 CN110674123B 公开(公告)日 2021-09-14
申请公布号 CN110674123B 申请公布日 2021-09-14
分类号 G06F16/215;G06F16/25;G06F16/28 分类 计算;推算;计数;
发明人 周曦;姚志强;刘志兵 申请(专利权)人 上海云从企业发展有限公司
代理机构 上海光华专利事务所(普通合伙) 代理人 尹丽云
地址 102300 北京市门头沟区石龙经济开发区永安路20号3号楼一层102室
法律状态 -

摘要

摘要 本发明提供一种数据预处理方法、装置、设备及介质,该方法包括:获取用户需求;在知识网络库内匹配与所述用户需求相适应的知识网络;如果匹配到与该用户需求相适应的知识网络时,则按照所述知识网络对数据源分类组合,在数据预处理过程中建立数据之间知识点相互关联的数据集;如果无法匹配到该用户需求相适应的知识网络时,则按所述用户需求预处理相关数据。在数据预处理阶段,结合与用户需求相适应的知识网络,对数据源分类组合,在数据预处理过程中建立数据之间知识点相互关联的数据集,而不是在每次有需求时,耗费大量时间重复过滤无用数据,简化了计算过程,本发明提高了数据预处理的效率,并降低了数据预处理的操作成本。