人类短片段串联重复序列高通量测序信息的处理方法
基本信息
申请号 | CN201610102496.2 | 申请日 | - |
公开(公告)号 | CN107122625A | 公开(公告)日 | 2017-09-01 |
申请公布号 | CN107122625A | 申请公布日 | 2017-09-01 |
分类号 | G06F19/20(2011.01)I;G06F19/22(2011.01)I;G06F19/24(2011.01)I;G06F19/26(2011.01)I;G06F19/28(2011.01)I | 分类 | 计算;推算;计数; |
发明人 | 周骋;姚旭斌;潘雅姣 | 申请(专利权)人 | 北京爱普益生物科技有限公司 |
代理机构 | 北京三高永信知识产权代理有限责任公司 | 代理人 | 北京爱普益生物科技有限公司 |
地址 | 100176 北京市大兴区经济技术开发区地盛东路1号爱普益大厦5层 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了人类短片段串联重复序列高通量测序信息的处理方法,属于生物检测领域。该方法为:保留单张芯片的STR高通量测序信息中具有预设测序长度的序列,形成第一序列;根据样本标签信息,将第一序列分类至不同样本文件夹中,根据STR目的片段特异引物信息,将第一序列再分类至不同STR基因座文件夹中,形成第二序列;建立针对不同STR基因座的阶梯参比序列,将第二序列与其中相应STR基因座的序列比对,保留序列相似度≥90%的第三序列;将样本测序条目数的阈值设为1000,将基因座测序条目数的阈值设为50,将基因座内分型测序条目数的阈值设为5,将基因座内分型测序条目数/基因座测序条目数的阈值设为40%,筛选第三序列中≥以上阈值的序列,得STR分型结果。 |
