一种基于用户聊天记录的标签挖掘方法及设备

基本信息

申请号 CN202011556453.4 申请日 -
公开(公告)号 CN112287076B 公开(公告)日 2021-04-02
申请公布号 CN112287076B 申请公布日 2021-04-02
分类号 G06F16/33(2019.01)I;G06F40/216(2020.01)I;G06F40/289(2020.01)I;G06F16/332(2019.01)I;G06F16/35(2019.01)I 分类 计算;推算;计数;
发明人 王清琛;张蹲;孟凡华;茆传羽;杜振东;程云;张洪磊 申请(专利权)人 南京云问网络技术有限公司
代理机构 南京瑞华腾知识产权代理事务所(普通合伙) 代理人 钱丽
地址 211106江苏省南京市江宁区胜利路89号紫金研创3栋302
法律状态 -

摘要

摘要 本发明公开了一种基于用户聊天记录的标签挖掘方法及设备。该方法包括对通过语音助手与用户闲聊生成的聊天数据进行预处理,基于标签抽取模型和统计方法从预处理后的聊天数据中抽取用户标签,基于关系发现模型挖掘相似度在设定阈值以上的所有标签。本发明借助神经网络的机器学习方法,使得模型可根据语义选择合适的标签,标签效果好;当系统运行一段时间后会积累更多的用户聊天数据,可以再次进行标注训练来达到更好的效果,可支持进一步优化;本发明在经过前期人工标注后,后期可以自动化抽取标签,节省了大量的人力,提升效率。