一种增值税发票信息的提取方法

基本信息

申请号 CN201911064339.7 申请日 -
公开(公告)号 CN110751136A 公开(公告)日 2020-02-04
申请公布号 CN110751136A 申请公布日 2020-02-04
分类号 G06K9/18;G06K9/36;G06K9/46;G06Q30/04 分类 计算;推算;计数;
发明人 罗中;宋爽;王君健 申请(专利权)人 北京亿信华辰软件有限责任公司武汉分公司
代理机构 - 代理人 -
地址 430200 湖北省武汉市光谷金融港B15栋7层
法律状态 -

摘要

摘要 本发明涉及一种增值税发票信息的提取方法,包括:首先,对发票图片进行预处理,使发票图片无旋转且方位正确,定位和识别发票监制章并根据发票监制章内容确定发票版式;然后,利用增值税发票的背景表格文字和打印内容的色调差异,从发票图片中提取蓝色调像素并二值化得到打印内容图片;接着,根据发票版式构造发票信息打印区域模板并利用模板对打印内容图片上的文本行进行区域匹配得到发票信息图片块;最后,对发票信息图片块进行文本识别以及综合分析得到发票信息提取结果。本发明所涉及的一种增值税发票信息提取方法相比于现有技术具有更好的容错性,对于发票打印内容和背景表格文字存在重叠干扰的情况,也能很好地进行发票信息提取。