一种短文本分类方法及装置
基本信息
申请号 | CN202010062909.5 | 申请日 | - |
公开(公告)号 | CN111309901A | 公开(公告)日 | 2020-06-19 |
申请公布号 | CN111309901A | 申请公布日 | 2020-06-19 |
分类号 | G06F16/35(2019.01)I;G06F40/30(2020.01)I | 分类 | - |
发明人 | 刘晓春;杨春宇;闫继培;王竞文 | 申请(专利权)人 | 北京海鑫科金高科技股份有限公司 |
代理机构 | 北京路浩知识产权代理有限公司 | 代理人 | 程琛 |
地址 | 100070北京市丰台区南四环西路186号汉威国际广场四区4号楼6层 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例公开了一种短文本分类方法及装置,方法包括:对目标短文本进行向量化处理,得到向量化目标短文本;提取所述向量化目标短文本的特征,得到向量化目标短文本特征;根据所述向量化目标短文本特征,确定所述目标短文本的语义向量;根据所述目标短文本的语义向量,确定所述目标短文本的类别。本发明实施例根据所述目标短文本的语义向量,确定所述目标短文本的类别,提高了分类精度,提高了分类准确率;克服了支持向量机模型分类只能进行二分类的问题,本发明支持多类分类;克服了支持向量机模型对大规模训练样本难以实施的问题;自动化对目标短文本进行分类,减少了工作人员工作量。 |
