一种非结构化文本的关键信息挖掘方法、介质及设备
基本信息
申请号 | CN201810058925.X | 申请日 | - |
公开(公告)号 | CN108280173B | 公开(公告)日 | 2021-05-11 |
申请公布号 | CN108280173B | 申请公布日 | 2021-05-11 |
分类号 | G06F16/33;G06F16/35;G06F40/242;G06F40/284 | 分类 | 计算;推算;计数; |
发明人 | 刘若初;郑则典;罗伟东 | 申请(专利权)人 | 深圳市和讯华谷信息技术有限公司 |
代理机构 | 北京酷爱智慧知识产权代理有限公司 | 代理人 | 安娜 |
地址 | 518000 广东省深圳市南山区南头关口二路智恒战略性新兴产业园7栋501 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种非结构化文本的关键信息挖掘方法、介质及设备。所述方法,包括:获取非结构文本的文本信息;采用分词算法,将所述文本信息解析为多个词向量;根据所述词向量,提取所述文本信息的语言模板;将所述语言模板与所述文本信息进行匹配,获得所述文本信息的关键信息;将所述关键信息输出给用户。通过根据文本信息的词向量,提取文本信息的语言模板,再将语言模板与文本信息进行匹配,提取文本信息的关键信息,能够从非结构化的文本信息中提取出结构化的语言模板,从而提取文本信息的关键信息,使用户能够快速获取文本中的关键信息,提高工作效率。 |
