一种基于SIVV特征的文档图像粗分类方法
基本信息
申请号 | CN201510227324.3 | 申请日 | - |
公开(公告)号 | CN104866822A | 公开(公告)日 | 2015-08-26 |
申请公布号 | CN104866822A | 申请公布日 | 2015-08-26 |
分类号 | G06K9/00(2006.01)I;G06K9/62(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 马廷淮;赵波;张正宇;霍晶晶 | 申请(专利权)人 | 学科网(北京)股份有限公司 |
代理机构 | 江苏爱信律师事务所 | 代理人 | 唐小红 |
地址 | 210044 江苏省南京市宁六路219号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种基于SIVV特征的文档图像粗分类方法,包括如下步骤:获取文档图像,预处理,加窗处理,计算文档图像SIVV特征,对每个文档分别计算与其他文档SIVV特征的相关系数,若其中K个文档两两之间相关系数均大于某一阈值,则认为这K个文档属于同一分类。本发明的目的,在于提出一种新的文档图像粗分类方法,无需准确获取文档文本内容,即可将文档图像根据SIVV特征的相关系数自动分成若干类,方法具有鲁棒性好、分类速度快的特点。 |
