一种基于Pacbiosubreads和Hi-Creads的全基因组分型方法专利查询专利号|摘要-满商公司网

一种基于Pacbiosubreads和Hi-Creads的全基因组分型方法

基本信息

申请号	CN202010441252.3	申请日	-
公开（公告）号	CN111816248A	公开（公告）日	2020-10-23
申请公布号	CN111816248A	申请公布日	2020-10-23
分类号	G16B20/00(2019.01)I	分类	物理
发明人	卢锐	申请（专利权）人	武汉菲沙基因信息有限公司
代理机构	上海精晟知识产权代理有限公司	代理人	武汉菲沙基因信息有限公司
地址	430000湖北省武汉市东湖高新技术开发区高新大道666号武汉国家生物产业基地项目B、C、D区研发楼B1栋
法律状态	-

摘要

本发明涉及一种基于Pacbio subreads和Hi‑C reads的全基因组分型方法，包括以下步骤：1)准备参考基因组；2)将二代测序数据比对到参考基因组，检测出各染色体的所有SNP位点；3)将Hi‑C建库测序数据比对到参考基因组，结合SNP位点，采用HapCUT2构建连锁SNP群；4)基于MVP Block对Pacbio subreads进行分组，然后再分别组装，最终获取到每条染色单体序列；5)对亲本基因组进行全基因组测序，将测序结果比对到上步分出的染色单体序列上，按照比对结果将染色单体分为两组，对应父母本基因组。本方法避开Hi‑C数据组装过程中无法组装酶切位点数太少的contigs的缺陷，而是采用从基因组整体出发先构建连锁SNP群，再结合Pacbio long reads，大大降低了分型的错误风险。