一种视频字幕文本提取和识别的方法

基本信息

申请号 CN201110315054.3 申请日 -
公开(公告)号 CN102332096B 公开(公告)日 2013-01-02
申请公布号 CN102332096B 申请公布日 2013-01-02
分类号 G06K9/20(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I 分类 计算;推算;计数;
发明人 刘成林;白博;殷飞 申请(专利权)人 北京中科阅深科技有限公司
代理机构 中科专利商标代理有限责任公司 代理人 周国城
地址 100190 北京市海淀区中关村东路95号
法律状态 -

摘要

摘要 本发明公开了一种视频字幕文本提取和识别的方法,其步骤包括:输入视频中字幕区域的图像;将输入图像转化为灰度图;判断字幕区域中字符排列的方向;将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域;对字幕区域进行分行得到单行字幕图像;对单行字幕区域图像自动判断前景颜色,得到单行字幕二值图像;对单行字幕二值图像进行过切分得到字符片段序列;对过切分后的单行字幕二值图像进行文本行识别。本方法能有效分割水平和竖直的视频字幕文本行,准确判断字符前景颜色并滤除噪声,并得到准确的字符切分与识别结果,可以适用于视频和图像内容编辑、索引与检索等多种用途。