一种语句归类方法及装置
基本信息
申请号 | CN201711448094.9 | 申请日 | - |
公开(公告)号 | CN108009157B | 公开(公告)日 | 2021-04-27 |
申请公布号 | CN108009157B | 申请公布日 | 2021-04-27 |
分类号 | G06F40/284;G06F16/35;G06K9/62 | 分类 | 计算;推算;计数; |
发明人 | 胡文凤;胡可云;陈联忠 | 申请(专利权)人 | 北京嘉和美康信息技术有限公司 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 王宝筠 |
地址 | 100085 北京市海淀区上地信息产业基地开拓路7号1幢三层2307室 | ||
法律状态 | - |
摘要
摘要 | 本申请实施例公开了一种语句归类方法,方法包括:获取病历文本,并对病历文本中的语句进行分割,得到若干个子句;对若干个子句进行分词,得到每一个子句的分词结果;根据每一个子句的分词结果以及属性词语概率表得到每一个子句属于各个属性的概率;基于每一个子句属于各个属性的概率确定每一个子句的待定属性;若存在至少两个相邻的且待定属性相同的子句,则将至少两个相邻的且待定属性相同的子句归为一类。这样,可以将不同类别的子句分开提取,避免了在结构化提取过程中会出现差错,进而提高了结构化提取的准确性,使得能够对一句话中的多个子句进行准确地结构化提取。 |
