基于深度学习的MHC-I表位亲和力预测方法

基本信息

申请号 CN202010539194.8 申请日 -
公开(公告)号 CN112002374A 公开(公告)日 2020-11-27
申请公布号 CN112002374A 申请公布日 2020-11-27
分类号 G16B40/00(2019.01)I 分类 物理
发明人 任树成;宋瑾;张恒辉;沈宁 申请(专利权)人 北京臻知医学科技有限责任公司
代理机构 北京中珒知识产权代理事务所(特殊普通合伙) 代理人 北京臻知医学科技有限责任公司
地址 102600北京市大兴区中关村科技园区大兴生物医药产业基地宝参南街16号院2号楼2层201-2
法律状态 -

摘要

摘要 本发明公开一种基于深度学习的MHC‑I表位亲和力预测方法,其包括:通过公共数据库获取多数个多肽;根据MHC‑I分子与肽的结合方式将所述多肽转换为21mer肽;提取所述多肽的特征,所述特征包括:序列特征、亲水性特征、极性特征和位置特征;分别对所述多肽的特征进行特征编码,得到4*21维的特征矩阵;将所述公共数据库中的多肽数据作为训练集进行模型训练,根据所述多肽的等位基因的分类,分别将所述多肽的特征矩阵输入预先建立的CNN模型建立预测模型,建立的预测模型的数量与所述多肽的等位基因的分类数据相对应;使用所述公共数据库的多肽数据作为所述预测模型的验证集进行结合亲和力测试。通过本申请能够有效预测MHC‑I表位亲和力,预测准确性较高且更稳定。