利用三代全长转录组的高原多倍体鱼类基因组注释方法

基本信息

申请号 CN202010226496.X 申请日 -
公开(公告)号 CN111445947A 公开(公告)日 2020-07-24
申请公布号 CN111445947A 申请公布日 2020-07-24
分类号 G16B20/10(2019.01)I 分类 -
发明人 袁晓辉;刘海平;肖世俊 申请(专利权)人 武汉古奥基因科技有限公司
代理机构 沈阳东大知识产权代理有限公司 代理人 武汉古奥基因科技有限公司
地址 430070湖北省武汉市洪山区珞狮路122号武汉理工大学孵化楼B座15楼
法律状态 -

摘要

摘要 本发明涉及基因组注释技术领域,提供一种利用三代全长转录组的高原多倍体鱼类基因组注释方法,包括:步骤1:将三代全长转录组测序序列比对到基因组,得到初始比对文件;步骤2:采用n种基因组预测方法分别预测可能的蛋白编码基因,得到n个比对文件;步骤3:根据比对文件提取外显子序列并比对到基因组,得到每种方法下各编码基因的结构信息;从初始比对文件中提取内含子剪切位点信息;结合每种方法下各编码基因的结构信息和内含子剪切位点信息,得到改进的蛋白编码序列;整合n种方法下改进的蛋白编码序列得到预测基因集。本发明能够同时利用三代全长转录组的高准确性及其提供的内含子剪切位点信息,提高了高原多倍体鱼类基因组注释的准确性。