一种HLA测序峰图识别方法

基本信息

申请号 CN201910026426.7 申请日 -
公开(公告)号 CN109753939B 公开(公告)日 2021-04-20
申请公布号 CN109753939B 申请公布日 2021-04-20
分类号 G06K9/00(2006.01)I 分类 计算;推算;计数;
发明人 丛华剑;王连水;洪轲;徐明;张倩;李庆林;张琛;齐效乾 申请(专利权)人 银丰基因科技有限公司
代理机构 济南泉城专利商标事务所 代理人 刘德
地址 250101山东省济南市高新区港兴三路1109号二期产业楼905室
法律状态 -

摘要

摘要 本发明公开了一种HLA测序峰图识别方法:(1)构建峰图识别模型:①收集已有的HLA下机峰图数据,②进行预处理,完成二进制ab1文件的信息提取,原始序列比对,序列分割以及错位修复工作;③特征提取;④收集大量人工已识别数据,利用随机森林算法训练数据,构建峰图识别模型;(2)利用峰图识别模型,对待测的HLA一代测序原始下机数据进行碱基识别;(3)整理识别好的碱基序列,将单链与双链部分序列重新组装;(4)输出识别结果。本发明的识别方法可准确获得峰图序列信息,整体准确率在99.5%以上,大大提高了HLA数据判读人员的工作效率。