利用纳米孔测序数据的高原多倍体鱼类基因组注释方法

基本信息

申请号 CN202010226518.2 申请日 -
公开(公告)号 CN111445949A 公开(公告)日 2020-07-24
申请公布号 CN111445949A 申请公布日 2020-07-24
分类号 G16B20/10(2019.01)I 分类 -
发明人 袁晓辉;刘海平;肖世俊 申请(专利权)人 武汉古奥基因科技有限公司
代理机构 沈阳东大知识产权代理有限公司 代理人 武汉古奥基因科技有限公司
地址 430070湖北省武汉市洪山区珞狮路122号武汉理工大学孵化楼B座15楼
法律状态 -

摘要

摘要 本发明涉及基因组注释技术领域,提供一种利用纳米孔测序数据的高原多倍体鱼类基因组注释方法,包括:步骤1:基于纳米孔测序技术获得待注释高原多倍体鱼的全长转录组序列;步骤2:采用n种基因组预测方法分别预测待注释高原多倍体鱼可能的蛋白编码基因;步骤3:将全长转录组序列作为参考序列,将每种基因组预测方法预测得到的每个蛋白编码基因与参考序列进行比对,计算每个蛋白编码基因相对参考序列的重叠率、重叠相似度;步骤4:过滤掉重叠率和重叠相似度均低于相应阈值的蛋白编码基因,对剩下的蛋白编码基因进行整合,得到最终的预测基因集。本发明能够提高高原多倍体鱼类基因组注释的准确性和可靠性,降低基因组注释的成本。