一种中医分词算法

基本信息

申请号 CN202010045614.7 申请日 -
公开(公告)号 CN111259667A 公开(公告)日 2020-06-09
申请公布号 CN111259667A 申请公布日 2020-06-09
分类号 G06F40/289(2020.01)I 分类 计算;推算;计数;
发明人 安静梅;张凯文;钱小菲;魏宇涛 申请(专利权)人 上海国民集团健康科技有限公司
代理机构 北京艾皮专利代理有限公司 代理人 上海国民集团健康科技有限公司
地址 201799上海市青浦区公园路348号3楼301-14室
法律状态 -

摘要

摘要 本发明公开了一种中医分词算法,具体步骤如下:首先是对中医医案的文本进行原子切分,其次引入中医领域词典和语料库完成N‑最短路径的粗切分以覆盖尽可能多的歧义,然后通过多层隐马模型对未登录词进行识别,接着用基于类的隐马模型进行全局最优分词,最后对分词结果进行词性标注,本发明打破中医领域分词效果差的瓶颈,为健康领域的智能对话和中医知识图谱,中医辅助诊疗系统奠定基础,提升基础语义组件的效果。