基于语音识别的病历数据处理方法和装置

基本信息

申请号 CN202011555959.3 申请日 -
公开(公告)号 CN112687365A 公开(公告)日 2021-04-20
申请公布号 CN112687365A 申请公布日 2021-04-20
分类号 G06F16/22(2019.01)I;G16H10/60(2018.01)I;G06K9/62(2006.01)I 分类 物理
发明人 罗立刚;张旸;陈超;刘辉 申请(专利权)人 零氪科技(天津)有限公司
代理机构 北京知果之信知识产权代理有限公司 代理人 卜荣丽
地址 300000天津市滨海新区自贸试验区(中心商务区)新华路3678号宝风大厦25层1单元房屋
法律状态 -

摘要

摘要 本申请公开了一种基于语音识别的病历数据处理方法和装置。该方法包括:针对音频性质的病历数据,通过采用语音识别模型,生成待识别的文本病历数据;建立结构化数据抽取模型,通过获取训练文本病历数据的标注数据,建立结构化建模网络架构,基于标注后得到的训练样本集训练结构化数据抽取模型,对结构化数据抽取模型进行校验迭代,获得标准结构化数据抽取模型;通过所述标准结构化数据抽取模型对所述文本病历数据进行处理,获得结构化病历数据,待识别音频数据依次通过语音识别模型和标准结构化数据抽取模型,达到了提高病历数据结构化程度的技术效果。