一种基于DNA测序数据的同源重组缺陷判定方法

基本信息

申请号 CN202010270712.0 申请日 -
公开(公告)号 CN111462823A 公开(公告)日 2020-07-28
申请公布号 CN111462823A 申请公布日 2020-07-28
分类号 G16B40/20(2019.01)I;G16B30/10(2019.01)I 分类 -
发明人 赵仲孟;戴道成;易鑫;易玉婷;管彦芳;王嘉寅;张选平 申请(专利权)人 北京吉因加科技有限公司
代理机构 西安通大专利代理有限责任公司 代理人 西安交通大学;北京吉因加科技有限公司
地址 710049陕西省西安市咸宁西路28号
法律状态 -

摘要

摘要 本发明公开了一种基于DNA测序数据的同源重组缺陷判定方法,获取特征属性;提取有效数据;基于三重学习法框架,考虑到较好的泛化能力、较高的准确度和对多维特征属性的处理效率,选择三个不同的基分类器H1、H2、H3;对H1、H2、H3进行迭代训练得到扩充训练集,由此对模型进行更新,完成训练过程;使用所训练的模型对未标记样本集U进行标记,根据标记结果完成HRD状态的判定。本发明解决了使用单一或少量基因组不稳定性状态等局部特征来进行HRD状态判定的局限性,克服临床上已知HRD状态的样本数量极少的难点,实现已有样本数据下的多特征属性的学习,能够提高HRD判定方法的性能。