人类短片段串联重复序列高通量测序信息的处理方法

基本信息

申请号 CN201610102496.2 申请日 -
公开(公告)号 CN107122625A 公开(公告)日 2017-09-01
申请公布号 CN107122625A 申请公布日 2017-09-01
分类号 G06F19/20(2011.01)I;G06F19/22(2011.01)I;G06F19/24(2011.01)I;G06F19/26(2011.01)I;G06F19/28(2011.01)I 分类 计算;推算;计数;
发明人 周骋;姚旭斌;潘雅姣 申请(专利权)人 北京爱普益生物科技有限公司
代理机构 北京三高永信知识产权代理有限责任公司 代理人 北京爱普益生物科技有限公司
地址 100176 北京市大兴区经济技术开发区地盛东路1号爱普益大厦5层
法律状态 -

摘要

摘要 本发明公开了人类短片段串联重复序列高通量测序信息的处理方法,属于生物检测领域。该方法为:保留单张芯片的STR高通量测序信息中具有预设测序长度的序列,形成第一序列;根据样本标签信息,将第一序列分类至不同样本文件夹中,根据STR目的片段特异引物信息,将第一序列再分类至不同STR基因座文件夹中,形成第二序列;建立针对不同STR基因座的阶梯参比序列,将第二序列与其中相应STR基因座的序列比对,保留序列相似度≥90%的第三序列;将样本测序条目数的阈值设为1000,将基因座测序条目数的阈值设为50,将基因座内分型测序条目数的阈值设为5,将基因座内分型测序条目数/基因座测序条目数的阈值设为40%,筛选第三序列中≥以上阈值的序列,得STR分型结果。