一种将金融文本结构化为表格的深度学习模型装置

基本信息

申请号 CN202110415793.3 申请日 -
公开(公告)号 CN113326676A 公开(公告)日 2021-08-31
申请公布号 CN113326676A 申请公布日 2021-08-31
分类号 G06F40/157(2020.01)I;G06F40/126(2020.01)I;G06F40/183(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 周靖宇;景泳霖;袁阳平;邹鸿岳 申请(专利权)人 北京快确信息科技有限公司
代理机构 深圳华屹智林知识产权代理事务所(普通合伙) 代理人 陈裕恒
地址 201700上海市青浦区浦仓路485号1幢2层
法律状态 -

摘要

摘要 一种将金融文本结构化为表格的深度学习模型装置,它包含以下步骤技术方案:步骤一,预处理,数据清洗,文本分词、形成字符和词,表格行标签;步骤二,词向量化;步骤三,字符编码层;步骤四,字符编码和词编码的连接层;步骤五,列信息的预测;步骤六,行信息的预测的前处理;步骤七,行信息的预测;步骤八,总loss函数的设置。通过一个模型,直接将非结构文本转换为表格数据,在金融的数据领域,达到了商业化的标准,相比于Pipeline的形式,其提高了3‑5个百分点,降低了pipeline的误差传递的问题。