对话数据集、安全检测模型的构建方法、对话系统的安全评估方法、介质及计算设备

基本信息

申请号 CN202111201090.7 申请日 -
公开(公告)号 CN113868398A 公开(公告)日 2021-12-31
申请公布号 CN113868398A 申请公布日 2021-12-31
分类号 G06F16/332(2019.01)I;G06F16/335(2019.01)I;G06F16/35(2019.01)I;G06F40/117(2020.01)I;G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 郑叔亮 申请(专利权)人 北京聆心智能科技有限公司
代理机构 北京箴思知识产权代理有限公司 代理人 李春晖
地址 100083 北京市海淀区成府路45号中关村智造大街C座四层409
法律状态 -

摘要

摘要 本发明公开一种对话数据集、安全检测模型的构建方法、对话系统的安全评估方法、介质及计算设备。其中对话数据集构建方法,包括:根据预设方式获取不同内部语境类别的对话数据,其中,每一个所述对话数据至少包括一对上下文语句;结合每一个对话数据中的上文语句,确定对应下文语句为安全或不安全;根据所述下文语句安全与否的结果,对每一个所述对话数据是否安全进行标记。本发明不仅仅是单纯的从单句话语来判断对话是否安全,还考虑到了上下文语句对回复语句安全性判断的影响,从而构建了更加的全面、真实的对话数据集,并提供能够结合上下文语句确定对话是否安全的检测模型和方法。