一种基于机器学习的财务报表数据自动识别和分析方法

基本信息

申请号 CN201910820809.1 申请日 -
公开(公告)号 CN110543475A 公开(公告)日 2019-12-06
申请公布号 CN110543475A 申请公布日 2019-12-06
分类号 G06F16/215(2019.01); G06F16/25(2019.01); G06F16/33(2019.01); G06F16/35(2019.01); G06F17/22(2006.01); G06Q10/06(2012.01); G06Q40/00(2012.01) 分类 计算;推算;计数;
发明人 李梓成; 刘广洲; 杨超凡 申请(专利权)人 深圳市原点参数信息技术有限公司
代理机构 北京鱼爪知识产权代理有限公司 代理人 深圳市原点参数科技有限公司;深圳市原点参数信息技术有限公司
地址 518033 广东省深圳市福田区福田街道福华三路国际商会中心2103室
法律状态 -

摘要

摘要 本发明提供一种基于机器学习的财务报表数据自动识别和分析方法,经由数据抽取模块进行数据抽取,通过数据清洗及文本聚合模块对文本内容进行筛选和组合,使之抽取的单个信息能形成完整的数据块或者文本块,然后对于所形成的数据块进行文档结构的分析和信息点的标注,由财务信息格式化模块提取其中的财务数据,然后通过检查之后输出财务数据。无法通过信息完整度检查的数据,由人工辅助子系统进行人工标记和纠正,并将标记和纠正的数据反馈给知识库进行大数据学习,从而训练文档结构及信息标注模块、财务信息格式化模块和信息完整度检查模块进行信息系统的训练升级,使之信息处理更加完善并形成数据解析闭环。