一种利用二代和三代转录组测序数据的基因组注释方法

基本信息

申请号 CN202010226474.3 申请日 -
公开(公告)号 CN111312331A 公开(公告)日 2020-06-19
申请公布号 CN111312331A 申请公布日 2020-06-19
分类号 G16B20/00(2019.01)I;G16B20/30(2019.01)I 分类 -
发明人 袁晓辉;刘海平;肖世俊 申请(专利权)人 武汉古奥基因科技有限公司
代理机构 沈阳东大知识产权代理有限公司 代理人 武汉古奥基因科技有限公司
地址 430070湖北省武汉市洪山区珞狮路122号武汉理工大学孵化楼B座15楼
法律状态 -

摘要

摘要 本发明涉及基因组注释技术领域,提供一种利用二代和三代转录组测序数据的基因组注释方法。本发明的方法包括下述步骤:步骤1:将三代全长转录组测序序列比对到目标基因组,得到各编码基因的初始结构信息;步骤2:将二代转录组测序短序列比对到目标基因组,从比对文件中提取内含子剪切位点信息;步骤3:结合各编码基因的初始结构信息和内含子剪切位点信息,获得各编码基因的最终结构信息。本发明既能充分利用三代转录组无须拼接即可得到全长转录本序列从而准确性高的优点,又能充分考虑二代转录组测序数据能够提供大量的内含子剪切位点证据的优点,大大提高了基因组注释的准确性和效率。