一种基于多维度信息检索的疾病对码方法

基本信息

申请号 CN201810216439.6 申请日 -
公开(公告)号 CN109243599A 公开(公告)日 2019-01-18
申请公布号 CN109243599A 申请公布日 2019-01-18
分类号 G16H50/20;G06F16/332;G06F17/27 分类 物理
发明人 汤潼 申请(专利权)人 申朴信息技术(上海)股份有限公司
代理机构 - 代理人 -
地址 200122 上海市浦东新区浦电路489号由由燕乔大厦14楼1407
法律状态 -

摘要

摘要 本发明公开了一种基于多维度信息检索的疾病对码方法,该方法涉及自然语言处理领域。该方法包括以下步骤:步骤1:采用基于自定义词库的分词器对目标疾病名词分词,所述分词器兼容同音字错误,解决同音错别字问题。步骤2:针对步骤1的分词结果基础上,进行多维度评估得出目标疾病名词所属的类别。该方法采用自然语言处理技术,从多个维度评估目标疾病名词与标准库的相似度,从而解决传统对码工作中效率低、准确性低的问题。