基于甲基化数据的癌症类型的预测方法及装置

基本信息

申请号 CN201710785909.6 申请日 -
公开(公告)号 CN107506600B 公开(公告)日 2021-05-14
申请公布号 CN107506600B 申请公布日 2021-05-14
分类号 G16H50/20;G16B20/30;G16B40/00;G16B30/00 分类 物理
发明人 杨飞;任一;陈昌岳;郑冠涛;王芳;李静;路远 申请(专利权)人 上海美吉生物医药科技有限公司
代理机构 上海光华专利事务所(普通合伙) 代理人 徐秋平
地址 201321 上海市浦东新区中国(上海)自由贸易试验区高科中路2810弄8号1204室单元D
法律状态 -

摘要

摘要 本发明提供基于甲基化数据的癌症类型的预测方法及装置,包括:从DNA甲基化芯片检测到的DNA序列的甲基化数据中随机选取某些位点的数据作为训练数据来训练分类器模型;其中,作为训练数据的甲基化数据所代表的癌症种类为已知;通过训练好的分类器模型预测未知癌症种类的DNA甲基化芯片数据可能代表的癌症种类,或预测单细胞或多细胞的甲基化测序数据可能代表的癌症种类。本发明从测得的甲基化数据中随机选取某些位点的数据来训练分类器,可以在待测癌种类型的样本的某些位点的甲基化数据没有获知时,令分类器根据和待测样本已获知的甲基化位点相同的位点的数据作训练,极大程度上提高了基于甲基化的癌种类型的预测的便利性。