一种肿瘤专病数据库构建系统、方法、电子设备和介质

基本信息

申请号 CN202011026999.9 申请日 -
公开(公告)号 CN112185572A 公开(公告)日 2021-01-05
申请公布号 CN112185572A 申请公布日 2021-01-05
分类号 G16H50/70(2018.01)I 分类 物理
发明人 许永超;魏博;马素芬;骆佳俊;李力行;凌少平 申请(专利权)人 志诺维思(北京)基因科技有限公司
代理机构 北京超凡宏宇专利代理事务所(特殊普通合伙) 代理人 志诺维思(北京)基因科技有限公司
地址 102200北京市昌平区沙河镇能源东路1号院1号楼3层309-3
法律状态 -

摘要

摘要 本申请提供了一种肿瘤专病数据库构建系统、方法、电子设备和介质,其中,该系统包括:数据拆分模块,用于将原始肿瘤专病病理文本拆分为基础文本信息和待结构化提取的文本信息;数据预处理模块;模型预测模块,用于对预处理后的文本信息进行预测;字典标注模块,用于对预处理后的文本信息进行字典标注;数据合并模块,用于对预测结果和字典标注结果进行数据合并;数据封装模块,用于将数据合并后的文本信息与基础文本信息进行数据封装;指标归一化模块,用于得到结构化病理文本;结构化数据存储模块,用于生成肿瘤专病数据库,可以提供病理文本结构化处理系统框架,深度考虑病理医生的需求而开发,深度契合病理科医生的生产和科研需求。