一种客服对话聚类方法和装置
基本信息
申请号 | CN201610282670.6 | 申请日 | - |
公开(公告)号 | CN107341157A | 公开(公告)日 | 2017-11-10 |
申请公布号 | CN107341157A | 申请公布日 | 2017-11-10 |
分类号 | G06F17/30(2006.01)I;G06F17/27(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 张凯;蔡宁;杨旭;付子豪 | 申请(专利权)人 | 阿里巴巴(北京)软件服务有限公司 |
代理机构 | 北京安信方达知识产权代理有限公司 | 代理人 | 李红爽;凌齐文 |
地址 | 北京市朝阳区望京东园四区9号楼3层301号 | ||
法律状态 | - |
摘要
摘要 | 本申请提出一种客服对话聚类方法和装置,包括:对收集到的原始语料按照预设类型进行划分,获得每一类角色语料;对每一类所述角色语料分别进行预处理,获得每一类角色分词语料;融合每一类所述角色分词语料,进行过滤停用词处理,获得过滤语料;对所述过滤语料进行文本处理;对经过文本处理后的所述过滤语料进行聚类操作,本发明在保留了原始对话的信息基础上,充分考虑了对话文本的不同参与者这一特性,对不同参与者进行不同的处理,有效地提高了聚类的准确性;在实际对话文本的聚类应用中效果理想。 |
