基因组序列中潜在BGC的预测方法、装置、设备及介质

基本信息

申请号 CN202110888145.X 申请日 -
公开(公告)号 CN113764034A 公开(公告)日 2021-12-07
申请公布号 CN113764034A 申请公布日 2021-12-07
分类号 G16B15/00(2019.01)I;G16B15/30(2019.01)I;G16B30/10(2019.01)I;G16B40/00(2019.01)I 分类 物理
发明人 杨子翊;廖奔犇;张胜誉;辛志伟;梁恒宇 申请(专利权)人 河南省健康元生物医药研究院有限公司
代理机构 北京三高永信知识产权代理有限责任公司 代理人 张所明
地址 518057广东省深圳市南山区高新区科技中一路腾讯大厦35层
法律状态 -

摘要

摘要 本申请公开了一种基因组序列中潜在BGC的预测方法、装置、设备及介质,涉及人工智能领域。方法包括:对基因组序列中的各个基因进行结构域预测,得到各个基因中包含的Pfam结构域;确定各个Pfam结构域的Pfam得分,Pfam得分用于表征Pfam结构域属于BGC的概率;基于各个Pfam结构域的Pfam得分,确定基因组序列中的候选BGC;对候选BGC进行BGC类别预测,并基于类别预测结果确定候选BGC中的潜在BGC。本申请实施例采用双重串行预测机制,先根据Pfam得分实现BGC的一级过滤,然后在一级过滤结果的基础上通过类别预测实现BGC的二级过滤,有助于降低BGC预测结果的假阳率。