一种视频文本提取的方法

基本信息

申请号 CN201610479702.1 申请日 -
公开(公告)号 CN107545210A 公开(公告)日 2018-01-05
申请公布号 CN107545210A 申请公布日 2018-01-05
分类号 G06K9/00(2006.01)I;G06K9/32(2006.01)I 分类 计算;推算;计数;
发明人 张师群;罗旻 申请(专利权)人 北京新岸线网络技术有限公司
代理机构 - 代理人 -
地址 100084 北京市海淀区中关村东路1号院清华科技园科技大厦A座16层
法律状态 -

摘要

摘要 本发明公开了一种视频文本提取的方法,包括:将视频序列分割成单个镜头;在单个视频帧序列中检测到和定位出候选文本的具体位置;在文本定位的基础上,在视频镜头内部对文本进行跟踪,得到同一文本对象在连续多帧的文本区域序列;利用文本跟踪得到的文本序列对文本进行增强,抑制背景,然后进行二值化,得到二值化文本图像;对二值化后的文本图像进行文本识别,得到文本的字符序列信息。采用本发明提供的技术方案,可以将视频中的文本更好地从复杂多边的背景中检测和分离出来,提高系统效率,并且提高文本的质量,从而有助于提高文本识别率。