基于自然语言处理的医学诊断文本分析标注方法

基本信息

申请号 CN202010446982.2 申请日 -
公开(公告)号 CN113705228A 公开(公告)日 2021-11-26
申请公布号 CN113705228A 申请公布日 2021-11-26
分类号 G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06F16/903(2019.01)I;G06F16/35(2019.01)I;G06F16/36(2019.01)I 分类 计算;推算;计数;
发明人 高鹏;金吕军;黄权力;桂璐 申请(专利权)人 中金慈云健康科技有限公司
代理机构 - 代理人 -
地址 100176北京市北京经济技术开发区博兴八路1号2幢2118室
法律状态 -

摘要

摘要 本发明提供了基于自然语言处理的医学诊断文本分析标注方法,包括以下步骤:S1、对医学诊断文本进行中文分词处理,得到医学分词序列;S2、对医学分词序列进行专用词性标注和医学语义识别处理,得到标准化阳性断语并集;S3、对标准化阳性断语集进行标签转化处理,得到医学诊断文本的阳性标签集。本发明的基于自然语言处理的医学诊断文本分析标注方法,通过自然语言处理技术结合多部位医学专用词库,针对不同医学部位采用相应的部位词库来进行分别处理,并通过正则表达式语义识别模型进行分析理解,使得对医学诊断文本的识别精确率指标达到100%,同时召回率指标达到80%以上。