一种文本结构化方法、文本结构化装置及终端设备
基本信息
申请号 | CN202010543935.X | 申请日 | - |
公开(公告)号 | CN111859968A | 公开(公告)日 | 2020-10-30 |
申请公布号 | CN111859968A | 申请公布日 | 2020-10-30 |
分类号 | G06F40/295(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 陈国;杨凤玲;魏政 | 申请(专利权)人 | 深圳航天科创实业有限公司 |
代理机构 | 深圳中一联合知识产权代理有限公司 | 代理人 | 深圳航天科创实业有限公司 |
地址 | 518000广东省深圳市南山区学苑大道1001号南山智园A5栋15层 | ||
法律状态 | - |
摘要
摘要 | 本申请适用于自然语言处理技术领域,提供了一种文本结构化方法、文本结构化装置及终端设备,所述方法包括:对待处理文本进行分词,得到词语序列,所述词语序列中包括至少一个词语;对所述词语序列中的各个词语进行词性标注,得到各个词语的词性;对所述待处理文本进行命名实体识别,得到命名实体序列,所述命名实体序列中包括至少一个命名实体;对所述命名实体序列中的各个命名实体进行语义角色标注,得到语义角色标注结果;根据所述词语序列、各个词语的词性、所述命名实体序列和所述语义角色标注结果,对所述待处理文本进行结构化处理,得到结构化文本。通过上述方法,可以在非结构化文本中发现关键信息,并将这些关键信息进行结构化。 |
