一种点评文本标签的自动提取方案
基本信息
申请号 | CN202110166250.2 | 申请日 | - |
公开(公告)号 | CN112800180A | 公开(公告)日 | 2021-05-14 |
申请公布号 | CN112800180A | 申请公布日 | 2021-05-14 |
分类号 | G06F16/33;G06F16/35;G06F40/279;G06F40/30;G06N3/04;G06N3/08;G06N7/00 | 分类 | 计算;推算;计数; |
发明人 | 岑袁京 | 申请(专利权)人 | 北京易车互联信息技术有限公司 |
代理机构 | 北京棘龙知识产权代理有限公司 | 代理人 | 李改平 |
地址 | 100089 北京市海淀区首都体育馆南路6号新世纪饭店3号写字楼十层D、E、F、G、H、J、单元 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种点评文本标签的自动提取方案,包括分词模块:对点评文本进行分词;词嵌入模型:根据海量文本训练处词语的embedd i ng向量表示;情感极性模型:判断文本的情感分类,以正向、负向、中性标记;得出点评结果。本申请的有益效果是:使用了机器学习的方式,自动化提取点评文本的文本标签,在保证正确性的基础上大大减少了人工标注的工作量,同时可挖掘词语的内在语义含义,通过对分散的文本标签进行聚类,减少文本标签的类别数,增强数据的准确性,通过文本情感极性模型的引入,可以直观地对文本进行情感分类,并通过点评文本和标签文本的情感极性判断,完善点评文本和标签文本的匹配效果。 |
