视频记录文稿生成方法、装置、存储介质以及电子设备
基本信息
申请号 | CN202110511724.2 | 申请日 | - |
公开(公告)号 | CN113450773A | 公开(公告)日 | 2021-09-28 |
申请公布号 | CN113450773A | 申请公布日 | 2021-09-28 |
分类号 | G10L15/04(2013.01)I;G10L15/06(2013.01)I;G10L15/26(2006.01)I | 分类 | 乐器;声学; |
发明人 | 徐波 | 申请(专利权)人 | 广东利为网络科技有限公司 |
代理机构 | 广州骏思知识产权代理有限公司 | 代理人 | 潘桂生 |
地址 | 510530广东省广州市萝岗区伴河路90号自编一栋305房 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种视频记录文稿生成方法、装置、存储介质以及电子设备,该方法包括:获取视频文件,从视频文件中分离出音频文件,将音频文件进行分割,得到多个音频片段,将每个音频片段输入至语音转向量模型,获得多个音频向量,将多个所述音频向量进行聚类,获得多个聚类簇,将包含音频向量个数最多的聚类簇确定为中心聚类簇,计算其他聚类簇的中心到中心聚类簇中心的相对距离,根据相对距离以及预设的颜色渐变表中每种颜色与相对距离的映射关系,确定每个聚类簇对应的颜色,将每个聚类簇对应的音频片段进行语音识别,生成音频片段对应的音频文字,给所述音频文字上色,生成视频记录文稿,提高了查找信息的效率,降低了人工成本。 |
