一种对中文语料进行标注识别的控制方法及控制装置
基本信息
申请号 | CN201910539314.1 | 申请日 | - |
公开(公告)号 | CN110298040A | 公开(公告)日 | 2019-10-01 |
申请公布号 | CN110298040A | 申请公布日 | 2019-10-01 |
分类号 | G06F17/27;G06F16/36;G16H70/20 | 分类 | 计算;推算;计数; |
发明人 | 嵇艺;徐盛;罗震 | 申请(专利权)人 | 翼健(上海)信息科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 200051 上海市长宁区长宁路1193号来福士广场T3商务楼1805-1806室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种对中文语料进行标注识别的控制方法,其通过语料模型对中文语料进行识别,包括如下步骤:a.基于字矢量词典以及中文语料确定矢量化中文语料,所述字矢量词典基于常规中文语料库以及医学语料库确定;b.将矢量化中文语料进行时序关联分析,确定时序中文语料;c.将时序中文语料进行最大似然推断确定标注中文语料,所述标注中文语料的标注信息至少包括精简标注以及复合标注。本发明使用简单,操作便捷,功能强大,实用性强,学习能力强大,识别高效准确,具有极高的商业价值。 |
