一种用于蛋白质功能预测的层级多标签分类方法

基本信息

申请号 CN201610452113.4 申请日 -
公开(公告)号 CN106126972B 公开(公告)日 2018-10-02
申请公布号 CN106126972B 申请公布日 2018-10-02
分类号 G06F19/18;G06F19/24 分类 计算;推算;计数;
发明人 冯收;付平;石金龙;郑文斌;徐明珠;鲁健捷;贾现召;周颖 申请(专利权)人 哈尔滨工业大学国家大学科技园发展有限公司
代理机构 哈尔滨市松花江专利商标事务所 代理人 哈尔滨工业大学;哈尔滨工业大学国家大学科技园发展有限公司
地址 150001 黑龙江省哈尔滨市南岗区西大直街92号
法律状态 -

摘要

摘要 一种用于蛋白质功能预测的层级多标签分类方法,涉及生物信息学及数据挖掘领域,尤其涉及一种用于蛋白质功能预测的层级多标签分类方法。本发明要为解决现有分类方法用于预测蛋白质功能时,存在数据集不平衡问题、多标签问题和层级约束问题。本发明所述方法按以下步骤进行:一、训练阶段:在训练阶段针对类标签层级结构中的每个节点的数据集采用一个SVM分类器进行训练,得到一组基础分类器;二、预测阶段:在预测阶段首先使用训练阶段获得的这组基础分类器得出未知样本的初步结果,而后采用带权重的TPR算法对结果进行处理,得到满足层级约束条件的最终结果,实现对蛋白质功能的预测。本发明应用于生物信息学及数据挖掘领域。