一种音视频数据的摘要生成方法、装置、设备和存储介质

基本信息

申请号 CN202111124453.1 申请日 -
公开(公告)号 CN113891177A 公开(公告)日 2022-01-04
申请公布号 CN113891177A 申请公布日 2022-01-04
分类号 H04N21/8549(2011.01)I;H04N21/233(2011.01)I;H04N21/439(2011.01)I;G10L15/04(2013.01)I;G10L15/14(2006.01)I;G10L15/16(2006.01)I;G10L15/06(2013.01)I 分类 电通信技术;
发明人 徐波 申请(专利权)人 广州多益网络股份有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 许庆胜
地址 510000广东省广州市萝岗区伴河路90号自编一栋305房
法律状态 -

摘要

摘要 本申请公开了一种音视频数据的摘要生成方法、装置、设备和存储介质,其中方法包括:获取待分析音视频数据中的语音帧数据;对所述语音帧数据进行说话人变化的分段,得到若干分段语音数据;对所述分段语音数据进行句子级别的特征提取,得到第一特征;对所述第一特征进行聚类,得到聚类结果;对所述分段语音数据中的语言内容进行识别,得到识别结果;根据所述聚类结果、所述识别结果,生成所述待分析音视频数据的摘要结果。解决了现有的音视频数据的摘要生成方法,效率较低的技术问题。