文本对话的连贯性识别方法、装置及计算设备

基本信息

申请号 CN202110581300.3 申请日 -
公开(公告)号 CN113268992A 公开(公告)日 2021-08-17
申请公布号 CN113268992A 申请公布日 2021-08-17
分类号 G06F40/30(2020.01)I;G06F40/211(2020.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 贾宇 申请(专利权)人 飒露紫科技文化(苏州)有限公司
代理机构 苏州华博知识产权代理有限公司 代理人 黄丽莉
地址 215300江苏省苏州市昆山市玉山镇祖冲之南路1699号辅楼1-006号
法律状态 -

摘要

摘要 本发明公开一种文本对话的连贯性识别方法、装置及计算设备,文本对话的连贯性识别方法包括以下步骤:获取文本数据;采用句向量相似度方法对获取的文本数据进行语义单元划分,文本数据划分成多个语义单元;提取每个语义单元的特征信息;搭建训练数据集,将训练数据集内的语义单元基于语义单元的顺序位置信息进行语义连贯性标注;利用RNN神经网络模型对训练数据集进行机器学习,实现对自然语言对话连贯性的识别。本发明提出一种自监督机器学习方法,可以有效实现对多轮对话连贯性的准确识别。