一种基于多基因风险打分构建疾病分类模型的方法

基本信息

申请号 CN202110355345.9 申请日 -
公开(公告)号 CN113066586A 公开(公告)日 2021-07-02
申请公布号 CN113066586A 申请公布日 2021-07-02
分类号 G16H50/70;G16H50/30;G06K9/62;G06N3/04;G06N3/08 分类 物理
发明人 马玉昆;孙琼琳;温颜华;张晓伟;颜红;李伟华 申请(专利权)人 北京果壳生物科技有限公司
代理机构 北京纪凯知识产权代理有限公司 代理人 闫书宁
地址 102206 北京市昌平区中关村生命科学园生命园路8号院6号楼8层
法律状态 -

摘要

摘要 本发明公开了一种基于多基因风险打分构建疾病分类模型的方法。该方法包括如下步骤:获取人群目标疾病的GWAS统计数据文件,对位点进行质控;获取训练集和检验集的全基因组的位点基因型及样品的疾病状态,基于训练集和检验集的全基因组位点分型数据分别对样品和位点进行质控,通过质控的样品及位点将被用于后续分析;根据不同策略筛选位点集合或调整位点效应值,采用五种不同方法的不同参数分别进行计算样品PRS;基于训练集样品的PRS和疾病状态构建疾病分类模型,并在检验集样品中验证疾病分类模型的效能,选择检验集中最优模型作为疾病预测器。本发明提供的方法可以帮助临床早期发现、预防目标疾病,具有重要的应用价值。