一种高效分布式大数据数据采集实现方法及系统

基本信息

申请号 CN202110965044.8 申请日 -
公开(公告)号 CN113420733B 公开(公告)日 2021-12-31
申请公布号 CN113420733B 申请公布日 2021-12-31
分类号 G06K9/00(2006.01)I;G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 杨昕 申请(专利权)人 北京黑马企服科技有限公司
代理机构 合肥上博知识产权代理事务所(特殊普通合伙) 代理人 郭堃;周超
地址 100000北京市怀柔区雁栖经济开发区雁栖大街53号院13号楼五层501-10室
法律状态 -

摘要

摘要 本发明公开了一种高效分布式大数据数据采集实现方法及系统,其中,所述方法包括:获得第一视频信息;对所述第一视频信息进行特征提取,获得所述第一视频信息的文字特征、语音特征和视觉特征;分别对所述文字特征、所述语音特征和所述视觉特征进行主成分分析,获得第一主成分特征集合;通过大数据获得第一视频集合,所述第一视频集合包括与所述第一主成分特征集合相匹配的视频集合;根据所述第一主成分特征集合对所述第一视频集合进行主成分特征数据采集。解决了现有技术中的无法对海量数据进行分布式的高效采集,使得采集得到的目标数据精确度不高的技术问题。