RNA序列编码潜力预测方法及系统

基本信息

申请号 CN202210419773.8 申请日 -
公开(公告)号 CN114694757A 公开(公告)日 2022-07-01
申请公布号 CN114694757A 申请公布日 2022-07-01
分类号 G16B40/00(2019.01)I;G16B40/20(2019.01)I;G16B25/00(2019.01)I;G16B20/00(2019.01)I;G06K9/62(2022.01)I 分类 物理
发明人 谌先敢;阳小飞;李臣鸿;陈素;林显光 申请(专利权)人 中南民族大学
代理机构 武汉智权专利代理事务所(特殊普通合伙) 代理人 -
地址 430000湖北省武汉市洪山区民族大道182号
法律状态 -

摘要

摘要 本发明提供一种RNA序列编码潜力预测方法及系统。该方法包括:从训练样本集合中选取ORF长度小于303nt的编码RNA作为待增强样本;对待增强样本进行数据增强处理,得到36类不同的伪RNA序列;将36类不同的伪RNA序列与原始训练数据结合,得到36个训练集合;通过36个训练集合训练36个基础分类器,得到36个基础分类模型;将36个基础分类模型的输出结果串联成36维特征向量;从36维特征向量中选取结果特征向量;将结果特征向量以及标签输入最终分类器进行训练,得到RNA序列编码潜力预测模型,通过RNA序列编码潜力预测模型进行RNA序列编码潜力预测。通过本发明,提高了RNA序列编码潜力预测准确性。