回访标注样本数据的生成方法及装置

基本信息

申请号 CN201910962631.4 申请日 -
公开(公告)号 CN110765776A 公开(公告)日 2020-02-07
申请公布号 CN110765776A 申请公布日 2020-02-07
分类号 G06F40/30;G10L15/26 分类 计算;推算;计数;
发明人 王福钋;杜新凯;赵义刚;李朋超 申请(专利权)人 阳光财产保险股份有限公司
代理机构 北京三友知识产权代理有限公司 代理人 阳光财产保险股份有限公司
地址 101100 北京市通州区永顺镇商通大道1号院2号楼三层
法律状态 -

摘要

摘要 本发明提供一种回访标注样本数据的生成方法及装置,其中,该方法包括:获取待标注的回访通话语音数据;对待标注的回访通话语音数据进行语音识别,得到回访文本数据;将回访文本数据中回访者与受访者的回复文本数据进行分离,得到待标注的回访文本数据;根据回访者的当前问题文本数据对应的话术类型,确定当前问题标识;根据当前问题标识和通话时间顺序,确定当前问题对应的受访者的待标注回复文本数据;根据待标注回复文本数据,确定待标注回复文本数据对应的标记;将待标注回复文本数据与确定出的标记进行关联,生成当前问题对应的回访标注样本数据,直至生成所有问题对应的回访标注样本数据。上述技术方案提高了回访标注样本数据生成的效率。