一种文本结构化方法、文本结构化装置及终端设备

基本信息

申请号 CN202010543935.X 申请日 -
公开(公告)号 CN111859968A 公开(公告)日 2020-10-30
申请公布号 CN111859968A 申请公布日 2020-10-30
分类号 G06F40/295(2020.01)I 分类 计算;推算;计数;
发明人 陈国;杨凤玲;魏政 申请(专利权)人 深圳航天科创实业有限公司
代理机构 深圳中一联合知识产权代理有限公司 代理人 深圳航天科创实业有限公司
地址 518000广东省深圳市南山区学苑大道1001号南山智园A5栋15层
法律状态 -

摘要

摘要 本申请适用于自然语言处理技术领域,提供了一种文本结构化方法、文本结构化装置及终端设备,所述方法包括:对待处理文本进行分词,得到词语序列,所述词语序列中包括至少一个词语;对所述词语序列中的各个词语进行词性标注,得到各个词语的词性;对所述待处理文本进行命名实体识别,得到命名实体序列,所述命名实体序列中包括至少一个命名实体;对所述命名实体序列中的各个命名实体进行语义角色标注,得到语义角色标注结果;根据所述词语序列、各个词语的词性、所述命名实体序列和所述语义角色标注结果,对所述待处理文本进行结构化处理,得到结构化文本。通过上述方法,可以在非结构化文本中发现关键信息,并将这些关键信息进行结构化。