基于第三代测序的多倍体基因组组装方法和装置

基本信息

申请号 CN202010250558.0 申请日 -
公开(公告)号 CN113496760A 公开(公告)日 2021-10-12
申请公布号 CN113496760A 申请公布日 2021-10-12
分类号 G16B20/10(2019.01)I;G16B30/10(2019.01)I;G16B30/20(2019.01)I 分类 物理
发明人 贺丽娟;杨林峰;徐煜;杨鑫;邓天全;高强 申请(专利权)人 深圳华大基因科技服务有限公司
代理机构 深圳鼎合诚知识产权代理有限公司 代理人 罗瑶;彭家恩
地址 518083广东省深圳市盐田区北山工业区综合楼科技创业园201
法律状态 -

摘要

摘要 一种基于第三代测序的多倍体基因组组装方法和装置,该方法包括:获取多倍体基因组的三代单分子测序数据并进行数据纠错和组装得到第一组装结果;将测序数据比对到第一组装结果进行深度评估并统计对整个基因组的覆盖度以获得组装出单拷贝和多拷贝的区域;选取组装出多拷贝的区域的序列进行序列之间的比对以去除覆盖在多拷贝区域内的序列之间的重复得到第一轮去冗余结果;鉴定并打断可能的错误连接后对基因组序列重新拼接以去除基因组上的拼接问题得到第二组装结果;确定去冗余成功后将第一组装结果中未包含到第二组装结果的部分序列合并到第二组装结果,然后进行优化和矫正得到第三组装结果。本发明能够有效地从复杂多倍体中分离出单套染色体组。