一种文本分类方法及装置

基本信息

申请号 CN202111199675.X 申请日 -
公开(公告)号 CN113849653A 公开(公告)日 2021-12-28
申请公布号 CN113849653A 申请公布日 2021-12-28
分类号 G06F16/35(2019.01)I;G06F16/33(2019.01)I;G06F40/194(2020.01)I;G06F40/279(2020.01)I;G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 胡加明;李健铨;刘小康;穆晶晶 申请(专利权)人 鼎富智能科技有限公司
代理机构 北京弘权知识产权代理有限公司 代理人 郭放;许伟群
地址 230000安徽省合肥市高新区习友路3333号A1楼19层-B区
法律状态 -

摘要

摘要 本申请实施例提供了一种文本分类方法及装置。其中,该方法包括:获取训练文本的表示向量和类别标签的标签向量;将训练文本向其对应的类别标签聚拢,以形成类别簇,并学习每个类别簇的决策边界;确定待分类文本是否位于全部类别簇的决策边界之外;如果待分类文本位于全部类别簇的边界之外,则待分类文本为未知类别;如果待分类文本不位于全部类别簇的边界之外,则与待分类文本相似度最大的类别标签所对应的类别为待分类文本的类别。这样,当有待分类文本位于全部类别簇的边界之外时,本申请实施例能够将待分类文本识别为未知意图,解决了目前的分类模型无法识别未知意图,以及将未知意图的文本分类到错误类别的问题。