基于自然语言处理的医学诊断文本分析标注方法
基本信息
申请号 | CN202010446982.2 | 申请日 | - |
公开(公告)号 | CN113705228A | 公开(公告)日 | 2021-11-26 |
申请公布号 | CN113705228A | 申请公布日 | 2021-11-26 |
分类号 | G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06F16/903(2019.01)I;G06F16/35(2019.01)I;G06F16/36(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 高鹏;金吕军;黄权力;桂璐 | 申请(专利权)人 | 中金慈云健康科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 100176北京市北京经济技术开发区博兴八路1号2幢2118室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了基于自然语言处理的医学诊断文本分析标注方法,包括以下步骤:S1、对医学诊断文本进行中文分词处理,得到医学分词序列;S2、对医学分词序列进行专用词性标注和医学语义识别处理,得到标准化阳性断语并集;S3、对标准化阳性断语集进行标签转化处理,得到医学诊断文本的阳性标签集。本发明的基于自然语言处理的医学诊断文本分析标注方法,通过自然语言处理技术结合多部位医学专用词库,针对不同医学部位采用相应的部位词库来进行分别处理,并通过正则表达式语义识别模型进行分析理解,使得对医学诊断文本的识别精确率指标达到100%,同时召回率指标达到80%以上。 |
