基于语音识别的病历数据处理方法和装置
基本信息
申请号 | CN202011555959.3 | 申请日 | - |
公开(公告)号 | CN112687365A | 公开(公告)日 | 2021-04-20 |
申请公布号 | CN112687365A | 申请公布日 | 2021-04-20 |
分类号 | G06F16/22(2019.01)I;G16H10/60(2018.01)I;G06K9/62(2006.01)I | 分类 | 物理 |
发明人 | 罗立刚;张旸;陈超;刘辉 | 申请(专利权)人 | 零氪科技(天津)有限公司 |
代理机构 | 北京知果之信知识产权代理有限公司 | 代理人 | 卜荣丽 |
地址 | 300000天津市滨海新区自贸试验区(中心商务区)新华路3678号宝风大厦25层1单元房屋 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种基于语音识别的病历数据处理方法和装置。该方法包括:针对音频性质的病历数据,通过采用语音识别模型,生成待识别的文本病历数据;建立结构化数据抽取模型,通过获取训练文本病历数据的标注数据,建立结构化建模网络架构,基于标注后得到的训练样本集训练结构化数据抽取模型,对结构化数据抽取模型进行校验迭代,获得标准结构化数据抽取模型;通过所述标准结构化数据抽取模型对所述文本病历数据进行处理,获得结构化病历数据,待识别音频数据依次通过语音识别模型和标准结构化数据抽取模型,达到了提高病历数据结构化程度的技术效果。 |
