一种中医分词算法
基本信息
申请号 | CN202010045614.7 | 申请日 | - |
公开(公告)号 | CN111259667A | 公开(公告)日 | 2020-06-09 |
申请公布号 | CN111259667A | 申请公布日 | 2020-06-09 |
分类号 | G06F40/289(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 安静梅;张凯文;钱小菲;魏宇涛 | 申请(专利权)人 | 上海国民集团健康科技有限公司 |
代理机构 | 北京艾皮专利代理有限公司 | 代理人 | 上海国民集团健康科技有限公司 |
地址 | 201799上海市青浦区公园路348号3楼301-14室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种中医分词算法,具体步骤如下:首先是对中医医案的文本进行原子切分,其次引入中医领域词典和语料库完成N‑最短路径的粗切分以覆盖尽可能多的歧义,然后通过多层隐马模型对未登录词进行识别,接着用基于类的隐马模型进行全局最优分词,最后对分词结果进行词性标注,本发明打破中医领域分词效果差的瓶颈,为健康领域的智能对话和中医知识图谱,中医辅助诊疗系统奠定基础,提升基础语义组件的效果。 |
