一种视频文本提取的方法
基本信息
申请号 | CN201610479702.1 | 申请日 | - |
公开(公告)号 | CN107545210A | 公开(公告)日 | 2018-01-05 |
申请公布号 | CN107545210A | 申请公布日 | 2018-01-05 |
分类号 | G06K9/00(2006.01)I;G06K9/32(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 张师群;罗旻 | 申请(专利权)人 | 北京新岸线网络技术有限公司 |
代理机构 | - | 代理人 | - |
地址 | 100084 北京市海淀区中关村东路1号院清华科技园科技大厦A座16层 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种视频文本提取的方法,包括:将视频序列分割成单个镜头;在单个视频帧序列中检测到和定位出候选文本的具体位置;在文本定位的基础上,在视频镜头内部对文本进行跟踪,得到同一文本对象在连续多帧的文本区域序列;利用文本跟踪得到的文本序列对文本进行增强,抑制背景,然后进行二值化,得到二值化文本图像;对二值化后的文本图像进行文本识别,得到文本的字符序列信息。采用本发明提供的技术方案,可以将视频中的文本更好地从复杂多边的背景中检测和分离出来,提高系统效率,并且提高文本的质量,从而有助于提高文本识别率。 |
