基于深度学习的多轮对话数据分类方法、装置和电子设备

基本信息

申请号 CN201810680888.6 申请日 -
公开(公告)号 CN109101537B 公开(公告)日 2021-08-06
申请公布号 CN109101537B 申请公布日 2021-08-06
分类号 G06F16/35;G06K9/62 分类 计算;推算;计数;
发明人 杨鹏 申请(专利权)人 北京慧闻科技(集团)有限公司
代理机构 北京睿邦知识产权代理事务所(普通合伙) 代理人 徐丁峰
地址 100000 北京市西城区西外大街辛137号宝蓝金融创新中心203室
法律状态 -

摘要

摘要 本申请涉及基于深度学习的多轮对话数据分类方法、装置和电子设备。该方法包括:对获取的当前轮次语句和先前轮次语句进行词向量转化以获得当前语句和先前语句的词向量;通过长短期记忆层处理当前语句和先前语句的词向量以获得当前轮次和先前轮次的句向量;以注意力机制层对先前轮次句向量进行加权求和以获得背景句向量;将当前轮次句向量与背景句向量连接以获得句子向量表达;以用于分类的逻辑回归模型处理句子向量表达以获得多轮对话数据相对于逻辑回归模型的多个标签的概率分布。这样,可以通过注意力机制从多轮对话数据中的先前轮次对话数据生成背景向量以与当前轮次对话数据的句向量结合进行分类,从而改进多轮对话场景下的分类效果。