一种基于后缀树算法的基因组测序序列与参考基因组比对的方法

基本信息

申请号 CN202011599753.0 申请日 -
公开(公告)号 CN112802553A 公开(公告)日 2021-05-14
申请公布号 CN112802553A 申请公布日 2021-05-14
分类号 G16B30/10 分类 物理
发明人 张静波;姬晓勇;高司航;单光宇;伍启熹;王建伟;刘倩;唐宇 申请(专利权)人 北京优迅医疗器械有限公司
代理机构 北京路浩知识产权代理有限公司 代理人 商秀玲
地址 102600 北京市大兴区中关村科技园区大兴生物医药产业基地永大路38号4号楼南半侧1至3层
法律状态 -

摘要

摘要 本发明涉及生物信息技术领域,具体涉及一种基于后缀树算法的基因组测序序列与参考基因组比对的方法。本发明提供的基于后缀树算法的基因组测序序列与参考基因组比对的方法包括构建参考基因组索引以及将基因组测序序列与参考基因组索引进行序列比对的步骤,其中,所述构建参考基因组索引包括如下步骤:(1)构建参考基因组索引的初步后缀树;(2)将所述初步后缀树中含有分叉的节点转换成节点数字,不含有分叉的节点转换成节点矩阵,构建后续用于比对的最终后缀树。本发明提供了一种占用内存相对较小、运行速度较快的、基于后缀树算法进行序列比对的方法,有效降低了读入索引对计算机内存的要求。