基于NGS的靶向测序数据模拟方法和装置

基本信息

申请号 CN201711498731.3 申请日 -
公开(公告)号 CN108229101A 公开(公告)日 2021-07-06
申请公布号 CN108229101A 申请公布日 2021-07-06
分类号 G06F19/20;G06F19/28 分类 计算;推算;计数;
发明人 党明浩;刘珂弟;张静波;关永涛;王伟伟;刘倩;唐宇 申请(专利权)人 北京科迅生物技术有限公司
代理机构 北京康信知识产权代理有限责任公司 代理人 赵囡囡
地址 100037 北京市海淀区四季青杏石口路65号益园C区C7
法律状态 -

摘要

摘要 本发明公开了一种基于NGS的靶向测序数据模拟方法和装置。其中,该方法包括:确定需要生成的模拟测序深度数据集所对应的多个目标区域bin,其中,模拟测序深度数据集包括多个bin中每个bin的模拟的测序深度;确定模拟测序深度数据集的期望值;生成服从以期望值为平均值、以预设方差为方差的正态分布的第一随机数,其中,预设方差为根据实际样本预先确定的方差;生成以第一随机数为平均值和方差的服从泊松分布的多个第二随机数;根据多个调整参数分别对多个第二随机数进行调整,生成模拟测序深度数据集。本发明解决了现有技术中由于需要生成模拟的测序序列数据导致CNV检测耗时较长,占用存储空间大的技术问题。