一种语料混淆处理方法、装置及介质

基本信息

申请号 CN202011438908.2 申请日 -
公开(公告)号 CN112507093A 公开(公告)日 2021-03-16
申请公布号 CN112507093A 申请公布日 2021-03-16
分类号 G06N3/04(2006.01)I;G06F16/33(2019.01)I;G06N3/08(2006.01)I;G06F16/332(2019.01)I;G06F40/216(2020.01)I;G06F40/30(2020.01)I;G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 尤翔远;周玉立;王刚;刘俊杰;沈懿忱;陈达 申请(专利权)人 税友软件集团股份有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 丁曼曼
地址 310053浙江省杭州市滨江区浦沿街道南环路3738号
法律状态 -

摘要

摘要 本申请公开了一种语料混淆处理方法包括获取待处理数据,从初始用户问中剔除存在混淆的用户问,而保留不存在混淆的用户问作为目标用户问;再将目标用户问和对应的目标标准问作为训练样本对所调用的分类模型进行训练;最后基于训练结果对目标用户问和目标标准问进行修复,直到训练结果满足预设要求为止。由此可见,应用于以上技术方案,通过对用户问进行筛选,可以发现并修复误标注的问题,从而提高训练样本的质量,进而提高分类模型的预测结果的准确性。此外本申请所公开的语料混淆处理装置及介质,与上述方法对应,效果同上。