数据属性确定方法、装置

基本信息

申请号 CN201710848242.X 申请日 -
公开(公告)号 CN110019829A 公开(公告)日 2019-07-16
申请公布号 CN110019829A 申请公布日 2019-07-16
分类号 G06F16/36 分类 计算;推算;计数;
发明人 宋奇;王思睿;姜萌芽;钟磊;秦锋剑 申请(专利权)人 小草数语(北京)科技有限公司
代理机构 北京清亦华知识产权代理事务所(普通合伙) 代理人 小草数语(北京)科技有限公司;绿湾网络科技有限公司
地址 100089 北京市海淀区西小口路66号中关村东升科技园B-6号楼B座5层
法律状态 -

摘要

摘要 本发明公开了一种数据属性确定方法及装置,其中,该方法包括:对格式化的原始数据进行拆分获取多个列数据;若所述列数据不包括列头内容,则根据所述列数据的数据类型确定所述列数据对应的候选属性集合;根据所述候选属性集合确定所述列数据的各单元内容的属性;对所述列数据的各单元内容的属性进行统计获取各个属性的置信度,根据所述置信度确定所述列数据的属性。该方法通过分门别类地查找列数据的候选属性集合,以及通过统计各个单元内容的属性确定列数据的属性,实现了尽可能地减少数据属性识别过程中的运算量,提升了数据属性的识别效率和准确率。