信息的分类抽取方法、装置、计算机设备和存储介质

基本信息

申请号 CN201711155288.X 申请日 -
公开(公告)号 CN107808011B 公开(公告)日 2021-04-13
申请公布号 CN107808011B 申请公布日 2021-04-13
分类号 G06F16/35(2019.01)I;G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 王昕;张剑;黄石磊;吉书龙 申请(专利权)人 深圳报业集团
代理机构 广州华进联合专利商标代理有限公司 代理人 谢曲曲
地址 518000广东省深圳市高新技术产业园区南区深港产学研基地大楼东座五楼
法律状态 -

摘要

摘要 本申请涉及一种信息的分类抽取方法、装置、计算机设备和存储介质,所述方法包括:获取公告信息,利用所述公告信息生成多个文本块;获取分类器,利用所述分类器对多个文本块进行分类,对分类后的文本块添加类别标签;根据所述类别标签对分类后的文本块进行分割,得到多个分割块;对多个类别标签对应的分割块进行筛选;计算与类别标签对应的筛选出的分割块之间的相关性,根据所述相关性对筛选出的分割块进行抽取;利用抽取到的分割块组成抽取结果信息。采用本方法能够提高信息抽取的效率。