一种基于半监督学习的深度图像手势估计方法

基本信息

申请号 CN202010503293.0 申请日 -
公开(公告)号 CN111797692B 公开(公告)日 2022-05-17
申请公布号 CN111797692B 申请公布日 2022-05-17
分类号 G06V20/64(2022.01)I;G06V40/20(2022.01)I;G06V10/774(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06T3/60(2006.01)I;G06T7/50(2017.01)I;G06T7/55(2017.01)I 分类 计算;推算;计数;
发明人 涂志刚;陈雨劲;张宇昊;刘军 申请(专利权)人 深圳英飞拓科技股份有限公司
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 代理人 -
地址 430072湖北省武汉市武昌区珞珈山武汉大学
法律状态 -

摘要

摘要 本发明公开了一种基于半监督学习的深度图像手势估计方法。相比于RGB图像,从深度图像中可以估计得到更高精度的手部姿态。而目前基于深度学习的手势估计方法虽然取得良好效果,但太过依赖于使用标注数据进行训练,然而对图像中的三维手势进行标注的过程十分复杂。本发明提出了一种高效的点云表达方式,有效的融合了局部特征与全局特征,实现高精度的从深度图像中估计出三维手部姿态的新方法。通过降低模型训练过程中对标注数据的依赖,从而减少了数据标注的成本。与此前的半监督学习的方法相比,本发明在保证运行效率的前提下,实现了手部姿态估计在精度上的突破。