一种文本分类方法和装置
基本信息
申请号 | CN202110046183.0 | 申请日 | - |
公开(公告)号 | CN112380350A | 公开(公告)日 | 2021-02-19 |
申请公布号 | CN112380350A | 申请公布日 | 2021-02-19 |
分类号 | G06F16/35(2019.01)I;G06F40/284(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 于游;姜巍;张珊珊;赵永强 | 申请(专利权)人 | 北京育学园健康管理中心有限公司 |
代理机构 | 北京绘聚高科知识产权代理事务所(普通合伙) | 代理人 | 罗硕 |
地址 | 100000北京市朝阳区太阳宫中路16号院1号楼4层408 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例提供一种文本分类方法和装置,本发明通过确定待分类的文本中的多个基本关键词,并确定用于表示基本关键词的在所述文本中的重要程度;当在所述多个基本关键词中确定位于预设的标签分类关键词表中的标签关键词,对所述标签关键词的基本权重加权,以增加该标签关键词的权重,与此同时,还基于预设的词向量模型确定与所述标签关键词关联的相关关键词,防止遗漏低频关键词;最终根据所述标签分类关键词表中关键词与分类结果的对应关系,所述基本关键词、标签关键词、相关关键词以及各自对应的权重值,综合确定出文本的分类结果,以提高分类结果的准确度。 |
