二代测序短序列快速比对分析方法及装置

基本信息

申请号 CN201610609337.1 申请日 -
公开(公告)号 CN106295250B 公开(公告)日 2019-03-29
申请公布号 CN106295250B 申请公布日 2019-03-29
分类号 G16B30/10(2019.01)I 分类 物理
发明人 郑洪坤; 郭强; 许德德; 马威锋; 孙乔慧 申请(专利权)人 北京普康瑞仁医学检验所有限公司
代理机构 北京路浩知识产权代理有限公司 代理人 李相雨
地址 101300 北京市顺义区南法信镇顺平路南法信段9号院1幢8层801室
法律状态 -

摘要

摘要 本发明公开一种二代测序短序列快速比对分析方法及装置,能够解决测序数据的比对效率低以及内存占用高的问题。所述方法包括:获取测序得到的DNA短序列,并采用第一hash算法和第二hash算法分别映射编码所述DNA短序列,分别得到第一索引和第二索引;基于预设的index查询库、所述第一索引和第二索引将所述DNA短序列和参考基因组进行比对,所述index查询库由单元结构体数组构成,每个单元结构体包含有value值和index2值,存储每个所述单元结构体的数组索引偏移量为对应的index1,即为结构体数组对应的索引值,K为片段序列长度;根据比对的结果,若比对上,则获取与对应的DNA短序列比对上的K‑mer片段的value值,确定出对应的DNA短序列所在染色体号和所在染色体上的位点。