一种视频OSD字符识别方法、装置及介质

基本信息

申请号 CN202210446762.9 申请日 -
公开(公告)号 CN114782941A 公开(公告)日 2022-07-22
申请公布号 CN114782941A 申请公布日 2022-07-22
分类号 G06V20/62(2022.01)I;G06V30/10(2022.01)I;G06V30/148(2022.01)I;G06V10/44(2022.01)I;G06V10/764(2022.01)I;G06V10/82(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 凌康杰;陈利军;林焕凯;洪曙光;王祥雪;刘双广 申请(专利权)人 高新兴科技集团股份有限公司
代理机构 广州国鹏知识产权代理事务所(普通合伙) 代理人 -
地址 510530广东省广州市黄埔区科学城开创大道2819号六楼
法律状态 -

摘要

摘要 本发明提供了一种视频OSD字符识别方法,其包括如下步骤:S1,获取OSD视频图像;S2,OSD视频图像输入至字符位置检测模块,得到字符位置信息;S3,将所述字符位置信息和所述OSD视频图像同时输入至字符位置裁剪模块,得到裁剪后的图像;所述字符位置裁剪模块对所述OSD视频图像中字符图像块的中心坐标随机偏移M个字符长度;S4,将所述裁剪后的图像输入至字符内容识别模块,输出识别到的字符串信息。本发明在识别字符过程中,同时使用了OSD字符的位置信息,可以加快模型收敛,提高识别的精度。