一种文本属性特征的识别、分类及结构分析方法及装置

基本信息

申请号 CN202010992100.2 申请日 -
公开(公告)号 CN111930953A 公开(公告)日 2020-11-13
申请公布号 CN111930953A 申请公布日 2020-11-13
分类号 G06F16/35(2019.01)I 分类 计算;推算;计数;
发明人 姜庭欣;陈伟然;李静毅;郭永红 申请(专利权)人 北京合享智慧科技有限公司
代理机构 北京三聚阳光知识产权代理有限公司 代理人 北京合享智慧科技有限公司
地址 100085北京市海淀区上地信息产业基地开拓路1号B座3层3008
法律状态 -

摘要

摘要 本发明公开了一种文本属性特征的识别、分类及结构分析方法及装置,该文本属性特征的识别方法包括:根据目标文本中的语句生成语法结构;根据语法结构中的节点关系生成数据结构;根据数据结构生成第一输入向量;根据第一输入向量及预设的文本属性特征分类模型确定各语句包含属性特征文本的概率;根据概率识别目标文本中的文本属性特征。通过实施本发明,能够准确识别目标文本中的文本属性特征,实现对文本内容的含义的识别,能够挖掘文本更深层次的含义,不仅能够丰富文本识别的内容,而且对于后续的基于文本识别内容的分析处理等过程,能够提供更加全面的数据及内容的支持。