一种流水文件识别方法、装置及计算机存储介质、电子设备

基本信息

申请号 CN201910846422.3 申请日 -
公开(公告)号 CN110728142A 公开(公告)日 2020-01-24
申请公布号 CN110728142A 申请公布日 2020-01-24
分类号 G06F40/289;G06F40/30;G06Q10/10;G06Q40/02 分类 计算;推算;计数;
发明人 龚伟松;范志海;徐毅;李高锋;张慧霞 申请(专利权)人 上海凯京信达科技集团有限公司
代理机构 北京新知远方知识产权代理事务所(普通合伙) 代理人 上海凯京信达科技集团有限公司
地址 200333 上海市普陀区大渡河路1718号C区308-1室
法律状态 -

摘要

摘要 一种流水文件识别方法、装置及计算机存储介质、电子设备,包括:确定待识别的文件;提取所述文件的字段;将每个字段进行分词得到多个词语;根据预先构建的语义空间将所述文件的每个词语向量化,生成字段向量;将所述字段向量与所述预先构建的语义空间中的每个向量进行匹配,得到每个字段的相关系数;在相关系数超过预设系数阈值的字段数量满足第一预设范围时,确定所述待识别的文件为流水文件。采用本申请中的方案,可以通过对待识别的文件进行字段提取、分词以及向量化处理,再结合预先构建的语义空间进行向量匹配,从而实现自动识别出各种流水文件、非流水文件,进而可以帮助信审和业务人员减少手动处理流水的时间,提高信审效率。