基于自然语言处理和集成训练的慢病数据分析方法及系统
基本信息
申请号 | 2020111164458 | 申请日 | - |
公开(公告)号 | CN112287665A | 公开(公告)日 | 2021-01-29 |
申请公布号 | CN112287665A | 申请公布日 | 2021-01-29 |
分类号 | G06F40/216(2020.01)I; | 分类 | 计算;推算;计数; |
发明人 | 亓晋;张及棠;孙雁飞;闫文卿 | 申请(专利权)人 | 南京南邮信息产业技术研究院有限公司 |
代理机构 | 南京正联知识产权代理有限公司 | 代理人 | 邓道花 |
地址 | 210038江苏省南京市经济技术开发区兴智路6号兴智科技园B座9楼 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了基于自然语言处理和集成训练的慢病数据分析方法及系统,系统包括数据预处理模块、数据识别模块、数据训练模块和数据可视化模块,数据预处理模块从外部的慢病数据库提取慢病数据生成对应的词向量,再将词向量量化作为训练样本;数据识别模块将训练样本的词向量输入到双向长短期记忆网络进行训练,得到隐藏向量并传送到条件概率场以计算字符标签;数据训练模块进行分类训练以提取慢病症状、生化病理指标和治疗间的三元关联模型,传送到数据可视化模块进行统计分析及传送到外部的用户界面模块呈现。从而达到充分利用大量的非结构化电子医疗数据、结合自然语言处理和集成训练神经网络来进行慢性病的成因分析、病情预测,从而对症下药。 |
