基于氨基酸知识图谱和主动学习的蛋白质改造方法

基本信息

申请号 CN202210121706.8 申请日 -
公开(公告)号 CN114678060A 公开(公告)日 2022-06-28
申请公布号 CN114678060A 申请公布日 2022-06-28
分类号 G16B5/00(2019.01)I;G16B35/00(2019.01)I;G16B40/00(2019.01)I;G06F16/36(2019.01)I;G06K9/62(2022.01)I 分类 物理
发明人 张强;秦铭;宫志晨;陈华钧 申请(专利权)人 浙江大学杭州国际科创中心
代理机构 杭州天勤知识产权代理有限公司 代理人 -
地址 311200浙江省杭州市萧山区建设三路733号
法律状态 -

摘要

摘要 本发明公开了一种基于氨基酸知识图谱和主动学习的蛋白质改造方法,包括:基于氨基酸的生化属性构建氨基酸知识图谱;结合氨基酸知识图谱对蛋白质数据进行数据增强,得到蛋白质增强数据并进行表示学习,得到第一蛋白质增强表示;利用预训练蛋白质模型对蛋白质数据,或蛋白质数据和氨基酸知识图谱进行表示学习,得到第二蛋白质增强表示;综合第一蛋白质增强表示和第二蛋白质增强表示,得到蛋白质增强表示;以蛋白质增强表示作为样本,采用主动学习从样本中筛选代表性样本并进行蛋白质性质的人工标注,利用人工标注的代表性样本训练蛋白质性质预测模型;利用蛋白质性质预测模型进行蛋白质改造,能够实现对蛋白质的快速准确改造。