一种中医实体识别算法

基本信息

申请号 CN202010057863.8 申请日 -
公开(公告)号 CN111259626A 公开(公告)日 2020-06-09
申请公布号 CN111259626A 申请公布日 2020-06-09
分类号 G06F40/117(2020.01)I 分类 计算;推算;计数;
发明人 安静梅;张凯文;钱小菲;魏宇涛 申请(专利权)人 上海国民集团健康科技有限公司
代理机构 北京艾皮专利代理有限公司 代理人 上海国民集团健康科技有限公司
地址 201799上海市青浦区公园路348号3楼301-14室
法律状态 -

摘要

摘要 本发明公开了一种中医实体识别算法,包含以下步骤:A、数据标注;将中医组收集的中医医案文本采用的是BIO的标注方式,B,即Begin,表示开始I,即Intermediate,表示中间O,即Other,表示其他,用于标记无关字符;B、预训练模型;使用预训练模型做微调的训练方式称为迁移学习;C、训练模型,本发明打破中医领域分词效果差的瓶颈,为健康领域的智能对话和中医知识图谱,中医辅助诊疗系统奠定基础,提升基础语义组件的效果。