信息的分类抽取方法、装置、计算机设备和存储介质
基本信息
申请号 | CN201711155288.X | 申请日 | - |
公开(公告)号 | CN107808011B | 公开(公告)日 | 2021-04-13 |
申请公布号 | CN107808011B | 申请公布日 | 2021-04-13 |
分类号 | G06F16/35(2019.01)I;G06K9/62(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 王昕;张剑;黄石磊;吉书龙 | 申请(专利权)人 | 深圳报业集团 |
代理机构 | 广州华进联合专利商标代理有限公司 | 代理人 | 谢曲曲 |
地址 | 518000广东省深圳市高新技术产业园区南区深港产学研基地大楼东座五楼 | ||
法律状态 | - |
摘要
摘要 | 本申请涉及一种信息的分类抽取方法、装置、计算机设备和存储介质,所述方法包括:获取公告信息,利用所述公告信息生成多个文本块;获取分类器,利用所述分类器对多个文本块进行分类,对分类后的文本块添加类别标签;根据所述类别标签对分类后的文本块进行分割,得到多个分割块;对多个类别标签对应的分割块进行筛选;计算与类别标签对应的筛选出的分割块之间的相关性,根据所述相关性对筛选出的分割块进行抽取;利用抽取到的分割块组成抽取结果信息。采用本方法能够提高信息抽取的效率。 |
