单菌DNA文库测序数据的注释方法及相关设备

基本信息

申请号 CN202111388983.7 申请日 -
公开(公告)号 CN114360647A 公开(公告)日 2022-04-15
申请公布号 CN114360647A 申请公布日 2022-04-15
分类号 G16B30/10(2019.01)I;G16B30/20(2019.01)I;G16B40/00(2019.01)I;G16B50/00(2019.01)I 分类 物理
发明人 葛琳娜;杨海生;李明壮 申请(专利权)人 荣联科技集团股份有限公司
代理机构 北京风雅颂专利代理有限公司 代理人 郑颖颖
地址 100080北京市海淀区北四环西路56号10层1002-1
法律状态 -

摘要

摘要 本申请提供一种单菌DNA文库测序数据的注释方法、装置、电子设备及存储介质。注释方法包括:对原始测序数据进行碱基质量评估、接头序列过滤、低质量序列过滤和低质量碱基过滤,得到高质量的序列数据;同时基于多种组装方法分别拼接高质量的序列数据,评估得到最优拼接序列数据;进行基因组结构预测、重复序列分析和CRISPR结构分析,得到最优拼接序列的预测结果信息;分别将最优拼接序列与多种功能数据库进行比对,得到最优拼接序列的功能注释信息。能够充分考虑各个分析环节的资源需求和分析时间等因素,具有良好的分析效率、任务调度、内存和线程分配等性能,能够高效的得到全面且可靠的单菌DNA文库测序数据的注释信息。