一种对音视频流中物品和语言实时识别分析的方法与装置

基本信息

申请号 CN202011451586.5 申请日 -
公开(公告)号 CN112637620A 公开(公告)日 2021-04-09
申请公布号 CN112637620A 申请公布日 2021-04-09
分类号 H04N21/2187;H04N21/231;H04N21/234;H04N21/431;H04N21/433;H04N21/434;H04N21/439;H04N21/44;H04N21/4788;H04N21/488;H04N21/6437 分类 电通信技术;
发明人 柏杨;樊晓昆 申请(专利权)人 杭州艾耕科技有限公司
代理机构 杭州天昊专利代理事务所(特殊普通合伙) 代理人 何碧珩;卓彩霞
地址 310052 浙江省杭州市滨江区六和路368号一幢(北)三楼D3052室
法律状态 -

摘要

摘要 本发明公开了一种对音视频流中物品和语言实时识别分析的方法与装置,本发明针对现有的直播平台,在直播时对音视频进行实时处理,实现物品识别,语音识别,并将识别的结果通过贴图的形式实时的展现在直播画面中,实现低延时的直播处理,使得观看者可以几乎无延迟的看到直播内容。本发明还可以根据直播音频内容产生丰富的关键字贴图,并实时的展现在画面上,直播画面的丰富度,减少了人工处理的成本,还可以通过物品识别,在画面上添加实时追踪的文字或者贴图,该类型的贴图人工是无法做到的。