一种基于深度学习提高单细胞蛋白质组鉴定覆盖率的方法

基本信息

申请号 CN202210331187.8 申请日 -
公开(公告)号 CN114639444A 公开(公告)日 2022-06-17
申请公布号 CN114639444A 申请公布日 2022-06-17
分类号 G16B25/10(2019.01)I;G16B35/20(2019.01)I;G06N20/00(2019.01)I 分类 物理
发明人 郭雪江;李妍;司徒成昊;王兵 申请(专利权)人 南京医科大学
代理机构 南京天华专利代理有限责任公司 代理人 -
地址 211166江苏省南京市江宁区龙眠大道101号
法律状态 -

摘要

摘要 本发明公开了一种基于深度学习提高单细胞蛋白质组鉴定覆盖率的方法,该方法包括:通过质谱实验产生多细胞蛋白质组和多个单细胞蛋白质组质谱数据,提取谱图信息进行预处理;根据肽段保留时间构建肽段保留时间预测模型;基于多细胞蛋白质组质谱数据作为谱图库,构建的深度学习模型来预测单细胞蛋白质组谱图碎片离子强度,并产生用于区分目标和诱饵PSM的特征;构建贝叶斯参数优化的集成学习模型对单细胞蛋白质组谱图质量进行重打分;基于正反库竞争方法控制谱图和蛋白水平的假发现率,进而将高可信性度的肽匹配谱图拼装为肽段、蛋白质进行定量。本发明有助于提高单细胞蛋白质组质谱数据的蛋白质鉴定水平,并促进单细胞蛋白质组学的未来发展和应用。