基于目标检测的研报解析方法、装置、设备和存储介质
基本信息
申请号 | CN202110380917.9 | 申请日 | - |
公开(公告)号 | CN112990091A | 公开(公告)日 | 2021-06-18 |
申请公布号 | CN112990091A | 申请公布日 | 2021-06-18 |
分类号 | G06K9/00;G06K9/46;G06N3/04;G06N3/08 | 分类 | 计算;推算;计数; |
发明人 | 朱召文;李宜博;李鹏 | 申请(专利权)人 | 数库(上海)科技有限公司 |
代理机构 | 上海十蕙一兰知识产权代理有限公司 | 代理人 | 刘秋兰 |
地址 | 201112 上海市闵行区陈行路2388号9号楼8层801室 | ||
法律状态 | - |
摘要
摘要 | 本发明属于数据处理技术领域,具体涉及一种基于目标检测的研报解析方法、装置、设备和存储介质。其中方法包括获取研报文件,通过目标检测模型对研报文件进行目标检测,得到目标检测结果;解析研报文件,获取研报文件内每一页中的字符信息,根据目标检测结果,将位于同一个目标内的字符进行合并,得到结构化信息;汇总研报文件内每一页的结构化信息,生成研报文件的结构化数据。本发明通过训练以研报版面分析为基础的目标检测模型,极大的简化了研报文件解析的流程,在不需要复杂规则的条件下,就可以充分的结构化研报内容。 |
