一种基于Pacbiosubreads和Hi-Creads的全基因组分型方法
基本信息
申请号 | CN202010441252.3 | 申请日 | - |
公开(公告)号 | CN111816248A | 公开(公告)日 | 2020-10-23 |
申请公布号 | CN111816248A | 申请公布日 | 2020-10-23 |
分类号 | G16B20/00(2019.01)I | 分类 | 物理 |
发明人 | 卢锐 | 申请(专利权)人 | 武汉菲沙基因信息有限公司 |
代理机构 | 上海精晟知识产权代理有限公司 | 代理人 | 武汉菲沙基因信息有限公司 |
地址 | 430000湖北省武汉市东湖高新技术开发区高新大道666号武汉国家生物产业基地项目B、C、D区研发楼B1栋 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种基于Pacbio subreads和Hi‑C reads的全基因组分型方法,包括以下步骤:1)准备参考基因组;2)将二代测序数据比对到参考基因组,检测出各染色体的所有SNP位点;3)将Hi‑C建库测序数据比对到参考基因组,结合SNP位点,采用HapCUT2构建连锁SNP群;4)基于MVP Block对Pacbio subreads进行分组,然后再分别组装,最终获取到每条染色单体序列;5)对亲本基因组进行全基因组测序,将测序结果比对到上步分出的染色单体序列上,按照比对结果将染色单体分为两组,对应父母本基因组。本方法避开Hi‑C数据组装过程中无法组装酶切位点数太少的contigs的缺陷,而是采用从基因组整体出发先构建连锁SNP群,再结合Pacbio long reads,大大降低了分型的错误风险。 |
