一种病原微生物参考知识库的最大多样性聚类构建方法
基本信息
申请号 | CN202110331409.1 | 申请日 | - |
公开(公告)号 | CN112800245A | 公开(公告)日 | 2021-07-16 |
申请公布号 | CN112800245A | 申请公布日 | 2021-07-16 |
分类号 | G06F16/36;G06F16/35;G16B30/10;G16B30/20;G06N5/02 | 分类 | 计算;推算;计数; |
发明人 | 李瑞琳;盖伟 | 申请(专利权)人 | 微岩医学科技(北京)有限公司 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 王欢 |
地址 | 100176 北京市大兴区济技术开发区经海四路156号院11号楼2层A区001室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及生物技术领域,具有涉及一种病原微生物参考知识库的最大多样性聚类构建方法。该构建采用贪心缩放算法,通过特定方法计算冗余基因组的多序列相似性,去除扩展相似度高的序列,可以保证在去除大量冗余信息的同时,最大程度保留微生物基因组的多样性。实验表明,本发明提供的病原微生物知识库的最大多样性聚类方法准确性高、检测效率高且数据冗余率低,尤其适用于大规模的病原微生物全基因组序列。 |
