智能客服机器人的语料构建方法及装置

基本信息

申请号 CN202110554295.7 申请日 -
公开(公告)号 CN113377951A 公开(公告)日 2021-09-10
申请公布号 CN113377951A 申请公布日 2021-09-10
分类号 G06F16/35(2019.01)I;G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 黄诗雅;罗睦军;邓从健 申请(专利权)人 广州云趣信息科技有限公司
代理机构 北京博雅睿泉专利代理事务所(特殊普通合伙) 代理人 马铁良
地址 510665广东省广州市天河区建工路4号6楼
法律状态 -

摘要

摘要 本公开涉及一种智能客服机器人的语料构建方法及装置,该方法包括:获取多个提问文本;对于获取的每一提问文本,根据提问文本包括的有效词语,将提问文本抽象为文本向量空间中的相应文本向量,文本向量空间的每一维度均对应于一个有效词语;根据每一提问文本对应的文本向量,将多个提问文本划分为K个分类,K为预设的正整数且K≥2,K的值等于设定的多个标准提问文本的个数;对于划分的每一分类,获取分类的标签,并以分类的标签作为分类下的提问文本的标签,标签包括一个标准提问文本和/或该标准提问文本对应的标准答案;根据提问文本和提问文本的标签,构建智能客服机器人的用于训练文本分类器的语料。