一种从PubMed文献准确识别分子相互作用及其极性和方向性方法

基本信息

申请号 CN201910571327.7 申请日 -
公开(公告)号 CN110349620A 公开(公告)日 2019-10-18
申请公布号 CN110349620A 申请公布日 2019-10-18
分类号 G16B15/00;G16B20/00;G06K9/62 分类 物理
发明人 汪佳宏;章建平;黄仲曦;潘星华 申请(专利权)人 广州序科码生物技术有限责任公司
代理机构 广州三环专利商标代理有限公司 代理人 广州序科码生物技术有限责任公司;南方医科大学
地址 510530 广东省广州市广州高新技术产业开发区科学城开源大道11号B3栋905室
法律状态 -

摘要

摘要 本发明提供了一种从PubMed文献准确识别分子相互作用及其极性和方向性方法:利用PubMed文献挖掘的形式在医学文献数据库识别含有至少两个基因获得候选证据句子,收集训练数据,收集互作词并对其分类,简化训练语句提取描述基因调控的常见表达模式;将常见表达模式制定Semgrex表达式,依存树上抓取两两基因和互作词的三元关系,确定分子相互作用的方向,并根据上下文语义校正和明确分子相互作用及其极性,在训练集上反复检验和优化识别方法,最终将建立的基因调控识别方法应用于医学文献数据库的候选证据句子的识别,获得准确的分子相互作用及其极性和方向。本发明最大的优点是通过表达模式和互作词的限定提高识别的准确率。