一种蛋白质结构预测方法及装置

基本信息

申请号 CN202011585063.X 申请日 -
公开(公告)号 CN112289370B 公开(公告)日 2021-03-23
申请公布号 CN112289370B 申请公布日 2021-03-23
分类号 G16B15/00(2019.01)I;G16B40/00(2019.01)I;G06N3/04(2006.01)I 分类 物理
发明人 华权高;赵海义;舒芹 申请(专利权)人 武汉金开瑞生物工程有限公司
代理机构 武汉蓝宝石专利代理事务所(特殊普通合伙) 代理人 刘璐
地址 430000湖北省武汉市东湖开发区高新大道666号武汉国家生物产业基地项目B、C、D区研发楼B1楼
法律状态 -

摘要

摘要 本发明涉及一种基于多任务时域卷积神经网络的蛋白质结构预测方法及装置,其方法包括:获取目的基因序列,以及蛋白质数据库;根据遗传密码表和蛋白质数据库建立每个蛋白质对应的DNA‑RNA‑氨基酸三元序列数据集;根据蛋白质数据库中的氨基酸的残基深度、物理化学性质建立多元回归方程,得到每个蛋白质的统计深度特征;将所述三元序列数据集进行聚类并映射为多维特征向量;将所述多维特征向量、蛋白质的统计深度特征作为多任务时域卷积神经网络的输入,训练所述多任务时域卷积神经网络;利用蛋白质的统计深度特征预测蛋白质结构。本发明将蛋白质的统计深度特征与多任务时域卷积神经网络结合,减少模型的复杂度,提高了泛化性、拟合度。