一种视频字幕文本提取和识别的方法
基本信息
申请号 | CN201110315054.3 | 申请日 | - |
公开(公告)号 | CN102332096B | 公开(公告)日 | 2013-01-02 |
申请公布号 | CN102332096B | 申请公布日 | 2013-01-02 |
分类号 | G06K9/20(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 刘成林;白博;殷飞 | 申请(专利权)人 | 北京中科阅深科技有限公司 |
代理机构 | 中科专利商标代理有限责任公司 | 代理人 | 周国城 |
地址 | 100190 北京市海淀区中关村东路95号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种视频字幕文本提取和识别的方法,其步骤包括:输入视频中字幕区域的图像;将输入图像转化为灰度图;判断字幕区域中字符排列的方向;将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域;对字幕区域进行分行得到单行字幕图像;对单行字幕区域图像自动判断前景颜色,得到单行字幕二值图像;对单行字幕二值图像进行过切分得到字符片段序列;对过切分后的单行字幕二值图像进行文本行识别。本方法能有效分割水平和竖直的视频字幕文本行,准确判断字符前景颜色并滤除噪声,并得到准确的字符切分与识别结果,可以适用于视频和图像内容编辑、索引与检索等多种用途。 |
