一种基于多维度信息检索的疾病对码方法
基本信息
申请号 | CN201810216439.6 | 申请日 | - |
公开(公告)号 | CN109243599A | 公开(公告)日 | 2019-01-18 |
申请公布号 | CN109243599A | 申请公布日 | 2019-01-18 |
分类号 | G16H50/20;G06F16/332;G06F17/27 | 分类 | 物理 |
发明人 | 汤潼 | 申请(专利权)人 | 申朴信息技术(上海)股份有限公司 |
代理机构 | - | 代理人 | - |
地址 | 200122 上海市浦东新区浦电路489号由由燕乔大厦14楼1407 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于多维度信息检索的疾病对码方法,该方法涉及自然语言处理领域。该方法包括以下步骤:步骤1:采用基于自定义词库的分词器对目标疾病名词分词,所述分词器兼容同音字错误,解决同音错别字问题。步骤2:针对步骤1的分词结果基础上,进行多维度评估得出目标疾病名词所属的类别。该方法采用自然语言处理技术,从多个维度评估目标疾病名词与标准库的相似度,从而解决传统对码工作中效率低、准确性低的问题。 |
