一种短文本分类方法及装置

基本信息

申请号 CN202010062909.5 申请日 -
公开(公告)号 CN111309901A 公开(公告)日 2020-06-19
申请公布号 CN111309901A 申请公布日 2020-06-19
分类号 G06F16/35(2019.01)I;G06F40/30(2020.01)I 分类 -
发明人 刘晓春;杨春宇;闫继培;王竞文 申请(专利权)人 北京海鑫科金高科技股份有限公司
代理机构 北京路浩知识产权代理有限公司 代理人 程琛
地址 100070北京市丰台区南四环西路186号汉威国际广场四区4号楼6层
法律状态 -

摘要

摘要 本发明实施例公开了一种短文本分类方法及装置,方法包括:对目标短文本进行向量化处理,得到向量化目标短文本;提取所述向量化目标短文本的特征,得到向量化目标短文本特征;根据所述向量化目标短文本特征,确定所述目标短文本的语义向量;根据所述目标短文本的语义向量,确定所述目标短文本的类别。本发明实施例根据所述目标短文本的语义向量,确定所述目标短文本的类别,提高了分类精度,提高了分类准确率;克服了支持向量机模型分类只能进行二分类的问题,本发明支持多类分类;克服了支持向量机模型对大规模训练样本难以实施的问题;自动化对目标短文本进行分类,减少了工作人员工作量。