基于大数据人工智能算法的祖源多态性预测方法

基本信息

申请号 CN201810004076.X 申请日 -
公开(公告)号 CN109993305A 公开(公告)日 2019-07-09
申请公布号 CN109993305A 申请公布日 2019-07-09
分类号 G06N3/12 分类 计算;推算;计数;
发明人 叶伟健;杨武兵;王勉 申请(专利权)人 成都二十三魔方生物科技有限公司
代理机构 深圳市万商天勤知识产权事务所(普通合伙) 代理人 王志明
地址 610000 四川省成都市高新区天府软件园E区6栋10楼
法律状态 -

摘要

摘要 本发明公开了基于大数据人工智能算法的祖源多态性预测方法,包括以下步骤:A:根据人群基因组数据,构建训练集合;B:对训练集合的群体样品进行基因定向,把定向后的两条单倍型进行1和‑1编码,同时对基因组进行窗口划分;C:通过投票策略选取最佳分类器,组成窗口观察序列,以分类器的结果作为下一步输入;D:构建窗口的转移矩阵和发射矩阵,建立隐马可夫模型;E:通过隐马可夫模型预测隐藏状态的概率分布,求出最优的祖源结果标签,作为最终结果输出。通过本发明可克服现有群体多态性方法对于遗传非常相近的群体,同时能够精细化预测染色体基因组片段的多态性,该方法对基因群体研究和某些群体关联疾病基因组片段定位起到重要作用。