二代测序短序列快速比对分析方法及装置
基本信息
申请号 | CN201610609337.1 | 申请日 | - |
公开(公告)号 | CN106295250B | 公开(公告)日 | 2019-03-29 |
申请公布号 | CN106295250B | 申请公布日 | 2019-03-29 |
分类号 | G16B30/10(2019.01)I | 分类 | 物理 |
发明人 | 郑洪坤; 郭强; 许德德; 马威锋; 孙乔慧 | 申请(专利权)人 | 北京普康瑞仁医学检验所有限公司 |
代理机构 | 北京路浩知识产权代理有限公司 | 代理人 | 李相雨 |
地址 | 101300 北京市顺义区南法信镇顺平路南法信段9号院1幢8层801室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种二代测序短序列快速比对分析方法及装置,能够解决测序数据的比对效率低以及内存占用高的问题。所述方法包括:获取测序得到的DNA短序列,并采用第一hash算法和第二hash算法分别映射编码所述DNA短序列,分别得到第一索引和第二索引;基于预设的index查询库、所述第一索引和第二索引将所述DNA短序列和参考基因组进行比对,所述index查询库由单元结构体数组构成,每个单元结构体包含有value值和index2值,存储每个所述单元结构体的数组索引偏移量为对应的index1,即为结构体数组对应的索引值,K为片段序列长度;根据比对的结果,若比对上,则获取与对应的DNA短序列比对上的K‑mer片段的value值,确定出对应的DNA短序列所在染色体号和所在染色体上的位点。 |
