一种流水文件识别方法、装置及计算机存储介质、电子设备
基本信息
申请号 | CN201910846422.3 | 申请日 | - |
公开(公告)号 | CN110728142A | 公开(公告)日 | 2020-01-24 |
申请公布号 | CN110728142A | 申请公布日 | 2020-01-24 |
分类号 | G06F40/289;G06F40/30;G06Q10/10;G06Q40/02 | 分类 | 计算;推算;计数; |
发明人 | 龚伟松;范志海;徐毅;李高锋;张慧霞 | 申请(专利权)人 | 上海凯京信达科技集团有限公司 |
代理机构 | 北京新知远方知识产权代理事务所(普通合伙) | 代理人 | 上海凯京信达科技集团有限公司 |
地址 | 200333 上海市普陀区大渡河路1718号C区308-1室 | ||
法律状态 | - |
摘要
摘要 | 一种流水文件识别方法、装置及计算机存储介质、电子设备,包括:确定待识别的文件;提取所述文件的字段;将每个字段进行分词得到多个词语;根据预先构建的语义空间将所述文件的每个词语向量化,生成字段向量;将所述字段向量与所述预先构建的语义空间中的每个向量进行匹配,得到每个字段的相关系数;在相关系数超过预设系数阈值的字段数量满足第一预设范围时,确定所述待识别的文件为流水文件。采用本申请中的方案,可以通过对待识别的文件进行字段提取、分词以及向量化处理,再结合预先构建的语义空间进行向量匹配,从而实现自动识别出各种流水文件、非流水文件,进而可以帮助信审和业务人员减少手动处理流水的时间,提高信审效率。 |
