一种将金融文本结构化为表格的深度学习模型装置
基本信息
申请号 | CN202110415793.3 | 申请日 | - |
公开(公告)号 | CN113326676A | 公开(公告)日 | 2021-08-31 |
申请公布号 | CN113326676A | 申请公布日 | 2021-08-31 |
分类号 | G06F40/157(2020.01)I;G06F40/126(2020.01)I;G06F40/183(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 周靖宇;景泳霖;袁阳平;邹鸿岳 | 申请(专利权)人 | 北京快确信息科技有限公司 |
代理机构 | 深圳华屹智林知识产权代理事务所(普通合伙) | 代理人 | 陈裕恒 |
地址 | 201700上海市青浦区浦仓路485号1幢2层 | ||
法律状态 | - |
摘要
摘要 | 一种将金融文本结构化为表格的深度学习模型装置,它包含以下步骤技术方案:步骤一,预处理,数据清洗,文本分词、形成字符和词,表格行标签;步骤二,词向量化;步骤三,字符编码层;步骤四,字符编码和词编码的连接层;步骤五,列信息的预测;步骤六,行信息的预测的前处理;步骤七,行信息的预测;步骤八,总loss函数的设置。通过一个模型,直接将非结构文本转换为表格数据,在金融的数据领域,达到了商业化的标准,相比于Pipeline的形式,其提高了3‑5个百分点,降低了pipeline的误差传递的问题。 |
