一种基于深度学习的上市公司公告分类及摘要生成方法

基本信息

申请号 CN201710255476.3 申请日 -
公开(公告)号 CN107403375A 公开(公告)日 2017-11-28
申请公布号 CN107403375A 申请公布日 2017-11-28
分类号 G06Q40/04;G06F17/30 分类 计算;推算;计数;
发明人 段清华;丁海星;郑锦光;王丛;张梦迪;鲍捷;马新磊 申请(专利权)人 北京文因互联科技有限公司
代理机构 北京万科园知识产权代理有限责任公司 代理人 杜澄心;张亚军
地址 100094 北京市海淀区北清路68号院24号楼D座4层695
法律状态 -

摘要

摘要 本发明公开了一种基于深度学习的上市公司公告分类及摘要生成方法,其步骤如下:步骤1、获取公告原文数据,提取文字、图片、表格信息,建立结构化文档。步骤2、基于公告领域行业知识,根据各种公司经营变动事件关键字区别,建立不同公告分类规则词库,统计判断公告类别;步骤3、针对不同分类的公告,提取公告文档内容,结合相应分类关键字规则词库,训练公告内容分类模型,自动生成文档摘要内容,包括内容提取、训练集选取、关键字优化模型、模型训练、模型测试、结果分析、内容生成。本发明可,解决针对每天产生的大量公告信息,自动对公告进行分类,并根据分类情况自动提取关键重要信息,生成摘要内容等技术问题。