一种基于3D深度卷积网络的人类行为识别的方法

基本信息

申请号 CN201710697809.8 申请日 -
公开(公告)号 CN107506712B 公开(公告)日 2021-05-18
申请公布号 CN107506712B 申请公布日 2021-05-18
分类号 G06K9/00;G06K9/62;G06N3/04 分类 计算;推算;计数;
发明人 高联丽;宋井宽;王轩瀚;邵杰;申洪宇 申请(专利权)人 中国农业银行股份有限公司成都锦城支行
代理机构 北京众合诚成知识产权代理有限公司 代理人 夏艳
地址 610015 四川省成都市高新区天府三街69号大源国际1栋21层2106号
法律状态 -

摘要

摘要 本发明属于计算机视觉视频动作识别领域,公开了一种基于3D深度卷积网络的人类行为识别的方法,所述方法首先将一个视频划分为一系列连续的视频片段;然后,将连续的视频片段输入到由卷积计算层和时空金字塔池化层组成的3D神经网络得到连续的视频片段特征;然后通过长短记忆模型计算全局的视频特征作为行为模式。本发明技术具有明显优势,通过改进了标准的3维卷积网络C3D,引入多级池化能够对任意分辨率和时长的视频片段进行特征提取;同时提高模型对行为变化大的鲁棒性,有利于在保持视频质量的情况下增加视频训练数据规模;通过各个运动子状态进行关联性信息嵌入提高行为信息的完整性。