一种从低质量核糖体印迹数据预测基因编码框的方法和系统

基本信息

申请号 CN201910407961.7 申请日 -
公开(公告)号 CN110136776A 公开(公告)日 2019-08-16
申请公布号 CN110136776A 申请公布日 2019-08-16
分类号 G16B20/00;G16B25/10 分类 物理
发明人 莫蓓莘;宋波;杨晓玉;高雷;陈雪梅 申请(专利权)人 中佳源物种(深圳)生物科技有限公司
代理机构 深圳市韦恩肯知识产权代理有限公司 代理人 深圳大学
地址 518000 广东省深圳市南山区深圳大学生命与海洋科学学院
法律状态 -

摘要

摘要 本发明公开一种从低质量核糖体印迹数据预测基因编码框的方法,本发明综合利用核糖体印迹和密码子使用频率进行蛋白编码框的预测,利用multitaper算法和复杂度对核糖体印迹数据质量进行描述,根据核糖体印迹数据的复杂度自动分配相应的权重,从而平衡数据质量的影响。具体的,本发明提取密码子使用频率,结合核糖体印迹数据的3碱基周期性,科学度量核糖体印迹的数据质量并合理分配相应权重,计算每个密码子位于核糖体P位点的概率,提取序列特征,通过统计分析综合评定编码框的预测概率值,进而预测新的编码框。本发明将大幅降低对核糖体印迹数据质量的要求,将极大促进核核体印迹技术应用的拓展,特别是在农作物研究中的应用。