病理报告解析方法及装置、存储介质、终端

基本信息

申请号 2020108259062 申请日 -
公开(公告)号 CN112289398A 公开(公告)日 2021-01-29
申请公布号 CN112289398A 申请公布日 2021-01-29
分类号 G16H15/00(2018.01)I; 分类 物理
发明人 秦晓宏;刘焕春 申请(专利权)人 上海柯林布瑞信息技术有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 周书敏;张振军
地址 200233上海市徐汇区宜山路700号普天信息产业园B2栋1504A
法律状态 -

摘要

摘要 一种病理报告解析方法及装置、存储介质及终端,所述方法包括:获取待解析病理报告;基于设定字词库,对所述待解析病理报告进行分词,得到分词后的待解析病理报告,其中,所述设定字词库采用如下方式得到:将若干个指定词典合并得到中间字词库,遍历所述中间字词库中的所有词,判断每个词是否能够进行再次分词,从所述中间字词库中删除能够进行再次分词的词,得到所述设定字词库;对所述分词后的待解析病理报告进行向量化,得到所述待解析病理报告对应的词向量集;采用预训练的病理报告解析模型对所述待解析病理报告对应的词向量集进行病理报告解析,得到病理报告解析结果;输出病理报告解析结果。上述方案能够提高病理报告的解析结果准确度。