基于最小哈希的时间序列相似性查询方法及装置

基本信息

申请号 CN201710601407.3 申请日 -
公开(公告)号 CN107368581A 公开(公告)日 2017-11-21
申请公布号 CN107368581A 申请公布日 2017-11-21
分类号 G06F17/30 分类 计算;推算;计数;
发明人 王宏志;赵志强 申请(专利权)人 工创集团有限公司
代理机构 北京格允知识产权代理有限公司 代理人 周娇娇;谭辉
地址 150001 黑龙江省哈尔滨市经开区哈平路集中区渤海路6号动漫基地F座509室
法律状态 -

摘要

摘要 本发明涉及一种基于最小哈希的时间序列相似性查询方法及系统,其中方法包括以下步骤:根据待测时间序列的数据范围以及预设的分割系数将所述待测时间序列划分到多个集合中,并采用数据点所在的集合编号组成的一维待测序列表示所述待测时间序列;采用同样的方法使用一维标准序列表示标准时间序列;计算所述一维待测序列和一维标准序列的最小哈希值相等的概率作为杰拉德系数。本发明提出的方法将最小哈希运算应用于基于集合的时间序列相似性查询当中,进一步减小了运算量,使这种基于集合的时间序列相似性查询算法更适用于大规模时间序列中。