一种针对易混淆运动损伤实体词的识别方法

基本信息

申请号 CN202110682430.6 申请日 -
公开(公告)号 CN113297851A 公开(公告)日 2021-08-24
申请公布号 CN113297851A 申请公布日 2021-08-24
分类号 G06F40/295;G06F40/126;G06F16/35;G06K9/62;G16H70/00 分类 计算;推算;计数;
发明人 李瑞瑞;李爽;赵伟 申请(专利权)人 北京富通东方科技有限公司
代理机构 - 代理人 -
地址 100086 北京市海淀区知春路128号泛亚大厦七层793室
法律状态 -

摘要

摘要 本发明公开了一种针对易混淆运动损伤实体词的识别方法,基于运动损伤领域的大规模文本语料,训练word2vec语义模型,将所述文本语料切割生成字符向量文本和词汇向量文本,采用自动标注工具标注训练集、验证集和测试集的字符向量文本和词汇向量文本;为所述字符向量文本和词汇向量文本创建编码并计算所述字符向量文本和词汇向量文本的相对位置编码。然后对字符向量文本和词汇向量文本进行第一次鉴别,得到所述字符向量文本和词汇向量文本的预测标签。将预测标签为症状、体征、检查结果和检验结果的实体词归类为待确定组,进行二次鉴别。通过上述方式,本发明能够有效鉴别运动损伤领域中实体词的类别。