进行数据压缩的方法、装置、系统和计算机程序产品

基本信息

申请号 CN201610118629.5 申请日 -
公开(公告)号 CN107153647B 公开(公告)日 2021-12-07
申请公布号 CN107153647B 申请公布日 2021-12-07
分类号 G06F16/2453(2019.01)I;G06F16/22(2019.01)I 分类 计算;推算;计数;
发明人 雷鹏 申请(专利权)人 奇简软件(北京)有限公司
代理机构 泰和泰律师事务所 代理人 祝海燕
地址 100041 北京市石景山区实兴大街30号院3号楼2层B-0035房间
法律状态 -

摘要

摘要 根据本发明的一种对数据进行压缩的方法包括以下步骤:为第一字符串集合创建第一前缀树,其中所述第一字符串集合包括多个原始字符串,其中前缀树由父‑子结点关系连接的多个结点构成,前缀树的每条边表示包含至少一个字符的字符串,该字符串对应于从该条边的父结点到子结点的状态转移;把所述第一前缀树中的边所对应的、长度至少为2的字符串作为第一字符串子集;当所述第一字符串子集中的任一字符串满足预定条件时,将该字符串分割为二个或多个字符串片段,所述字符串片段与所述第一字符串子集中未被分割的字符串一起形成分割字符串集合;使用所述第一前缀树和所述分割字符串集合来保存所述第一字符串集合,以利用原始字符串之间的冗余而实现数据压缩。本发明还提供了对数据进行压缩的装置、系统和计算机程序产品。