一种非结构化文本的关键信息挖掘方法、介质及设备

基本信息

申请号 CN201810058925.X 申请日 -
公开(公告)号 CN108280173B 公开(公告)日 2021-05-11
申请公布号 CN108280173B 申请公布日 2021-05-11
分类号 G06F16/33;G06F16/35;G06F40/242;G06F40/284 分类 计算;推算;计数;
发明人 刘若初;郑则典;罗伟东 申请(专利权)人 深圳市和讯华谷信息技术有限公司
代理机构 北京酷爱智慧知识产权代理有限公司 代理人 安娜
地址 518000 广东省深圳市南山区南头关口二路智恒战略性新兴产业园7栋501
法律状态 -

摘要

摘要 本发明提供了一种非结构化文本的关键信息挖掘方法、介质及设备。所述方法,包括:获取非结构文本的文本信息;采用分词算法,将所述文本信息解析为多个词向量;根据所述词向量,提取所述文本信息的语言模板;将所述语言模板与所述文本信息进行匹配,获得所述文本信息的关键信息;将所述关键信息输出给用户。通过根据文本信息的词向量,提取文本信息的语言模板,再将语言模板与文本信息进行匹配,提取文本信息的关键信息,能够从非结构化的文本信息中提取出结构化的语言模板,从而提取文本信息的关键信息,使用户能够快速获取文本中的关键信息,提高工作效率。