无人机航拍视频内容识别方法、装置及系统

基本信息

申请号 CN202010946775.3 申请日 -
公开(公告)号 CN112183236A 公开(公告)日 2021-01-05
申请公布号 CN112183236A 申请公布日 2021-01-05
分类号 G06K9/00;G06K9/62;G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 吴晓琳;杜永红;张凯;夏林元;杨嘉贺 申请(专利权)人 佛山聚卓科技有限公司
代理机构 广州三环专利商标代理有限公司 代理人 胡枫;曹万菊
地址 528000 广东省佛山市南海区桂城街道大圩社区永安北路2号金谷智创产业社区A座第三层314单位(住所申报)
法律状态 -

摘要

摘要 本发明公开了一种基于深度学习的无人机航拍视频内容识别方法,包括:实时获取无人机拍摄的视频图像;对视频图像进行抽帧处理以提取样本图像,对样本图像进行预处理;对样本图像中的待识别物体进行标注,生成物体类别数据库;利用数据增强技术扩充物体类别数据库;利用扩充后的物体类别数据库训练深度神经网络模型,深度神经网络模型为SSD网络模型,SSD网络模型包括多分支卷积结构及多尺度特征图融合结构;使用训练好的深度神经网络模型识别视频图像,以输出每个物体类别的位置信息与尺寸信息。本发明还公开了一种基于深度学习的无人机航拍视频内容识别装置及系统。采用本发明可有效解决航拍视频物体检测中存在的类别识别和位置定位相互影响的问题。