一种区分RNA测序数据中基因表达差异与长拷贝数变异的方法

基本信息

申请号 CN202110752233.7 申请日 -
公开(公告)号 CN113284558A 公开(公告)日 2021-08-20
申请公布号 CN113284558A 申请公布日 2021-08-20
分类号 G16B30/00(2019.01)I 分类 物理
发明人 鲍远亮;王义亭;王佳 申请(专利权)人 赛福解码(北京)基因科技有限公司
代理机构 北京同辉知识产权代理事务所(普通合伙) 代理人 刘洪勋
地址 100000北京市海淀区北四环西路52号13层1505
法律状态 -

摘要

摘要 本发明公开了一种区分RNA测序数据中基因表达差异与长拷贝数变异的方法,包括以下步骤:先用已知不含CNV的样本和对照样本分别提取RNA,建库测序、质控、比对,得到比对结果BAM文件;统计原始reads count并进行标准化处理,得到矫正后reads count文件,过滤掉部分对照样本后合并得到原始reads count矩阵文件;使用差异表达检测软件检测测试样本中的差异表达基因,获得每个外显子的坐标区间,确定判断阈值,再用待测试样本替换已知不含CNV的样本重复操作,根据阈值来判断为拷贝数变异或表达差异。该方法判断准确,操作方便。