基因组序列中潜在BGC的预测方法、装置、设备及介质
基本信息
申请号 | CN202110888145.X | 申请日 | - |
公开(公告)号 | CN113764034A | 公开(公告)日 | 2021-12-07 |
申请公布号 | CN113764034A | 申请公布日 | 2021-12-07 |
分类号 | G16B15/00(2019.01)I;G16B15/30(2019.01)I;G16B30/10(2019.01)I;G16B40/00(2019.01)I | 分类 | 物理 |
发明人 | 杨子翊;廖奔犇;张胜誉;辛志伟;梁恒宇 | 申请(专利权)人 | 河南省健康元生物医药研究院有限公司 |
代理机构 | 北京三高永信知识产权代理有限责任公司 | 代理人 | 张所明 |
地址 | 518057广东省深圳市南山区高新区科技中一路腾讯大厦35层 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种基因组序列中潜在BGC的预测方法、装置、设备及介质,涉及人工智能领域。方法包括:对基因组序列中的各个基因进行结构域预测,得到各个基因中包含的Pfam结构域;确定各个Pfam结构域的Pfam得分,Pfam得分用于表征Pfam结构域属于BGC的概率;基于各个Pfam结构域的Pfam得分,确定基因组序列中的候选BGC;对候选BGC进行BGC类别预测,并基于类别预测结果确定候选BGC中的潜在BGC。本申请实施例采用双重串行预测机制,先根据Pfam得分实现BGC的一级过滤,然后在一级过滤结果的基础上通过类别预测实现BGC的二级过滤,有助于降低BGC预测结果的假阳率。 |
