基因压缩多流数据并行写入及读取方法、系统及介质

基本信息

申请号 CN201911303221.5 申请日 -
公开(公告)号 CN111061434B 公开(公告)日 2021-10-01
申请公布号 CN111061434B 申请公布日 2021-10-01
分类号 G06F3/06(2006.01)I 分类 计算;推算;计数;
发明人 李根;冯博伦;徐霞丽;黄能超;唐俊翔;毛海波;蒋艳凰;马丑贤;王振国 申请(专利权)人 人和未来生物科技(长沙)有限公司
代理机构 湖南兆弘专利事务所(普通合伙) 代理人 邹大坚;刘畅舟
地址 410000湖南省长沙市长沙高新开发区文轩路27号麓谷钰园C2栋1101号
法律状态 -

摘要

摘要 本发明公开了一种基因压缩多流数据并行写入方法,包括以下步骤:1)接收写入请求后,创建基因数据存储文件,所述基因数据存储文件包括文件头和文件体,所述文件头保存有文件类型标识符和文件版本号,在文件体创建根控制块和子控制块,分别在根控制块和/或子控制块下创建字节流,所述字节流与待接收的基因压缩多流数据的数据流一一对应;2)接收基因压缩多流数据,并将数据流写入对应字节流的写缓存,若任意一条字节流的写缓存达到预设阈值则生成写入任务并放入队列,且通过读写线程异步执行队列中的写入任务将写缓存数据写入基因数据存储文件。本发明在保证了对基因压缩多流数据读写高性能的同时,也支持多条顺序的数据流的随机读取。