一种病原微生物参考知识库的最大多样性聚类构建方法

基本信息

申请号 CN202110331409.1 申请日 -
公开(公告)号 CN112800245A 公开(公告)日 2021-07-16
申请公布号 CN112800245A 申请公布日 2021-07-16
分类号 G06F16/36;G06F16/35;G16B30/10;G16B30/20;G06N5/02 分类 计算;推算;计数;
发明人 李瑞琳;盖伟 申请(专利权)人 微岩医学科技(北京)有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 王欢
地址 100176 北京市大兴区济技术开发区经海四路156号院11号楼2层A区001室
法律状态 -

摘要

摘要 本发明涉及生物技术领域,具有涉及一种病原微生物参考知识库的最大多样性聚类构建方法。该构建采用贪心缩放算法,通过特定方法计算冗余基因组的多序列相似性,去除扩展相似度高的序列,可以保证在去除大量冗余信息的同时,最大程度保留微生物基因组的多样性。实验表明,本发明提供的病原微生物知识库的最大多样性聚类方法准确性高、检测效率高且数据冗余率低,尤其适用于大规模的病原微生物全基因组序列。