多倍体基因组同源染色体的拆分方法、装置及其应用

基本信息

申请号 2020111743639 申请日 -
公开(公告)号 CN112289382A 公开(公告)日 2021-01-29
申请公布号 CN112289382A 申请公布日 2021-01-29
分类号 G16B30/20(2019.01)I; 分类 物理
发明人 李本萍;王璐;王迪;周勋;陶琳娜 申请(专利权)人 天津诺禾致源生物信息科技有限公司
代理机构 北京康信知识产权代理有限责任公司 代理人 路秀丽
地址 301700天津市武清区武清开发区创业总部基地B07
法律状态 -

摘要

摘要 本发明提供了一种多倍体基因组同源染色体的拆分方法、装置及其应用。其中拆分方法包括:根据HiC数据与多倍体基因组序列比对得到的比对文件,计算基因组重叠群间的互作强度和重叠群内的互作强度;根据各重叠群内的互作强度对连接错误的重叠群进行打断;利用打断后的重叠群进行相互比对,得到重叠群间的相似度;根据重叠群间的互作强度和重叠群间的相似度对所有重叠群进行聚类,实现对多倍体基因组同源染色体的拆分。先通过利用重叠群内的互作强度识别错误连接的重叠群,并在错误的地方进行打断。再通过识别重叠群间的相似性,利用重叠群间的互作强度和相似度高低进行聚类,从而能够有效的将同源染色体进行拆分。