一种表数据泛化方法及装置

基本信息

申请号 CN202210184206.9 申请日 -
公开(公告)号 CN114548303A 公开(公告)日 2022-05-27
申请公布号 CN114548303A 申请公布日 2022-05-27
分类号 G06K9/62(2022.01)I;G06F40/30(2020.01)I;G06F40/177(2020.01)I;G06F21/62(2013.01)I 分类 计算;推算;计数;
发明人 张正欣;牟黎明;王豪;肖春亮;张宏;何坤 申请(专利权)人 神州绿盟成都科技有限公司
代理机构 北京同达信恒知识产权代理有限公司 代理人 -
地址 610015四川省成都市中国(四川)自由贸易试验区成都高新区和乐二街150号C区5栋1层
法律状态 -

摘要

摘要 本申请公开了一种表数据泛化方法及装置,用以提升表数据泛化的效率。该方法包括:确定待泛化的表中多个表数据分别包括的各类型的子数据,其中子数据的类型包括数值型、包含语义的第一文本型以及不包含语义的第二文本型;根据任一表数据包括的各类型的子数据的距离参数,确定其与各中心点的距离;其中数值型子数据与各中心点的数值型变量的相似程度为其距离参数;第一文本型子数据与各中心点的第一文本型变量的相似程度为其距离参数;第二文本型子数据的距离参数指示其与各中心点的第二文本型变量是否相同;根据各表数据与各中心点的距离,将多个表数据划分为至少一个类别簇;采用设定的数据泛化算法对至少一个类别簇分别进行泛化处理。