基于CNV-seq测序数据检测多倍体和基因组纯合区域ROH的系统

基本信息

申请号 CN202010896507.5 申请日 -
公开(公告)号 CN113113081B 公开(公告)日 2021-12-14
申请公布号 CN113113081B 申请公布日 2021-12-14
分类号 G16B20/20(2019.01)I;G16B20/30(2019.01)I;G16B30/10(2019.01)I 分类 物理
发明人 黄铨飞;彭春方;饶兴蔷;陈样宜 申请(专利权)人 东莞博奥木华基因科技有限公司
代理机构 广州嘉权专利商标事务所有限公司 代理人 许飞
地址 523808广东省东莞市松山湖高新技术产业开发区桃园路1号莞台生物技术合作育成中心11栋
法律状态 -

摘要

摘要 本发明公开了基于CNV‑seq测序数据检测多倍体和基因组纯合区域ROH的系统。发明人研究发现,不同类型的样本或基因组区域对应的基因型的种类和占比是不同的,在在极低平均测序深度下,虽然每个SNP位点的基因型不可知,但是同一测序深度下不同类型的样本/基因组区域观察到的杂合信号P(1,1)的概率不同。通过合并计算N个SNP杂合信息、计算SNP混合杂合度指标以判断样本的倍型信息和是否存在基因组纯合区域ROH。打破了现有低平均测序深度数据不能用于判断ROH和多倍体的局限,大幅减少了ROH和多倍体检测的成本。