一种基于Pacbiosubreads和Hi-Creads的全基因组分型方法

基本信息

申请号 CN202010441252.3 申请日 -
公开(公告)号 CN111816248A 公开(公告)日 2020-10-23
申请公布号 CN111816248A 申请公布日 2020-10-23
分类号 G16B20/00(2019.01)I 分类 物理
发明人 卢锐 申请(专利权)人 武汉菲沙基因信息有限公司
代理机构 上海精晟知识产权代理有限公司 代理人 武汉菲沙基因信息有限公司
地址 430000湖北省武汉市东湖高新技术开发区高新大道666号武汉国家生物产业基地项目B、C、D区研发楼B1栋
法律状态 -

摘要

摘要 本发明涉及一种基于Pacbio subreads和Hi‑C reads的全基因组分型方法,包括以下步骤:1)准备参考基因组;2)将二代测序数据比对到参考基因组,检测出各染色体的所有SNP位点;3)将Hi‑C建库测序数据比对到参考基因组,结合SNP位点,采用HapCUT2构建连锁SNP群;4)基于MVP Block对Pacbio subreads进行分组,然后再分别组装,最终获取到每条染色单体序列;5)对亲本基因组进行全基因组测序,将测序结果比对到上步分出的染色单体序列上,按照比对结果将染色单体分为两组,对应父母本基因组。本方法避开Hi‑C数据组装过程中无法组装酶切位点数太少的contigs的缺陷,而是采用从基因组整体出发先构建连锁SNP群,再结合Pacbio long reads,大大降低了分型的错误风险。