RNA序列编码潜力预测方法及系统
基本信息
申请号 | CN202210419773.8 | 申请日 | - |
公开(公告)号 | CN114694757A | 公开(公告)日 | 2022-07-01 |
申请公布号 | CN114694757A | 申请公布日 | 2022-07-01 |
分类号 | G16B40/00(2019.01)I;G16B40/20(2019.01)I;G16B25/00(2019.01)I;G16B20/00(2019.01)I;G06K9/62(2022.01)I | 分类 | 物理 |
发明人 | 谌先敢;阳小飞;李臣鸿;陈素;林显光 | 申请(专利权)人 | 中南民族大学 |
代理机构 | 武汉智权专利代理事务所(特殊普通合伙) | 代理人 | - |
地址 | 430000湖北省武汉市洪山区民族大道182号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种RNA序列编码潜力预测方法及系统。该方法包括:从训练样本集合中选取ORF长度小于303nt的编码RNA作为待增强样本;对待增强样本进行数据增强处理,得到36类不同的伪RNA序列;将36类不同的伪RNA序列与原始训练数据结合,得到36个训练集合;通过36个训练集合训练36个基础分类器,得到36个基础分类模型;将36个基础分类模型的输出结果串联成36维特征向量;从36维特征向量中选取结果特征向量;将结果特征向量以及标签输入最终分类器进行训练,得到RNA序列编码潜力预测模型,通过RNA序列编码潜力预测模型进行RNA序列编码潜力预测。通过本发明,提高了RNA序列编码潜力预测准确性。 |
