一种高通量测序数据匹配方法

基本信息

申请号 CN201410376285.9 申请日 -
公开(公告)号 CN105320850A 公开(公告)日 2016-02-10
申请公布号 CN105320850A 申请公布日 2016-02-10
分类号 G06F19/22(2011.01)I 分类 计算;推算;计数;
发明人 张艺;何飞;马丰收;邹晓文 申请(专利权)人 晶能生物技术(上海)有限公司
代理机构 - 代理人 -
地址 201111 上海市闵行区元江路5500号第2幢1187室
法律状态 -

摘要

摘要 本发明属于在分子生物学技术领域,本发明属于分子生物信息检测领域,具体涉及在已有高通量DNA测序数据匹配基础上,基于环境平台修正因子增加测序数据的匹配数量,以提高测序数据的利用率的一种高通量DNA测序数据匹配方法。本发明包括:获取测序数据;初步匹配高通量DNA测序数据得到匹配成功数据集和匹配失败数据集;设置基于实验平台和环境的匹配修正因子k;用基于修正因子k的模型对匹配失败集中数据重新匹配;提取测序数据匹配失败集中成功匹配数据。本发明在原有高通量DNA测序数据匹配映射基础上,通过评估匹配失败测序数据集中数据发生成功匹配的可能,进一步增加成功匹配映射的数据数量,以提高测序数据的利用率。