一种医疗术语库的形成方法和装置

基本信息

申请号 CN201810444927.2 申请日 -
公开(公告)号 CN108763197B 公开(公告)日 2021-11-09
申请公布号 CN108763197B 申请公布日 2021-11-09
分类号 G06F40/216(2020.01)I;G06F40/58(2020.01)I;G16H10/00(2018.01)I 分类 计算;推算;计数;
发明人 梁平 申请(专利权)人 广州依图医疗技术有限公司
代理机构 北京同达信恒知识产权代理有限公司 代理人 黄志华
地址 200336 上海市长宁区娄山关路523号23楼06、07单元
法律状态 -

摘要

摘要 本发明实施例涉及医疗术语库领域,尤其涉及一种医疗术语库的形成方法和装置,用以解决对第二语言的医疗术语库翻译规模大的问题。本发明实施例中,从第一语言的医疗记录中获取第一语言的医学短语;针对同一个医学短语,从多个第一语言的医学短语中筛选出数量大于设定阈值的,作为高频的医学短语;确定高频的医学短语在第二语言的医学术语库中对应的第二语言的概念;从第二语言的医学术语库中获取第二语言的概念对应的第二语言的拓扑信息;将第二语言的概念翻译为第一语言的概念、将第二语言的拓扑信息翻译为第一语言的拓扑信息;根据多个第一语言的概念及多个第一语言的拓扑信息,构建第一语言的医学术语库。减小翻译第二语言的医学短语的数量。