直播平台语音收集方法、系统及存储介质

基本信息

申请号 CN202010066065.1 申请日 -
公开(公告)号 CN111625614A 公开(公告)日 2020-09-04
申请公布号 CN111625614A 申请公布日 2020-09-04
分类号 G06F16/31(2019.01)I 分类 计算;推算;计数;
发明人 宁思乔;刘德友 申请(专利权)人 全息空间(深圳)智能科技有限公司
代理机构 北京挺立专利事务所(普通合伙) 代理人 全息空间(深圳)智能科技有限公司
地址 518000广东省深圳市福田区梅林街道北环大道7014号深华运输大楼301A-02
法律状态 -

摘要

摘要 本发明公开了一种直播平台语音收集方法、系统及存储介质,该语音收集方法包括如下步骤:S1:一种直播平台语音收集方法,其包括如下步骤:S1:确认用户身份、收集用户在直播平台上操作产生的原始语音文件;S2:对S1所得原始语音文件进行清洗、筛除原始语音文件中的破损文件、形成一次数据;S3:将S2所得一次数据转化为文本文件、并将该文本文件按对应用户ID进行存储;S4:对S3所得文本文件进行清洗、筛除含有乱码的文本文件、形成二次数据;S5:对S4所得二次数据进行关键词抓取、并依据关键词进行排序、形成三次数据。本发明能够能够对用户产生的语音数据进行筛选、收集和排序、从而实现对用户更精准的智能服务推送。