一种点评文本标签的自动提取方案

基本信息

申请号 CN202110166250.2 申请日 -
公开(公告)号 CN112800180A 公开(公告)日 2021-05-14
申请公布号 CN112800180A 申请公布日 2021-05-14
分类号 G06F16/33;G06F16/35;G06F40/279;G06F40/30;G06N3/04;G06N3/08;G06N7/00 分类 计算;推算;计数;
发明人 岑袁京 申请(专利权)人 北京易车互联信息技术有限公司
代理机构 北京棘龙知识产权代理有限公司 代理人 李改平
地址 100089 北京市海淀区首都体育馆南路6号新世纪饭店3号写字楼十层D、E、F、G、H、J、单元
法律状态 -

摘要

摘要 本申请公开了一种点评文本标签的自动提取方案,包括分词模块:对点评文本进行分词;词嵌入模型:根据海量文本训练处词语的embedd i ng向量表示;情感极性模型:判断文本的情感分类,以正向、负向、中性标记;得出点评结果。本申请的有益效果是:使用了机器学习的方式,自动化提取点评文本的文本标签,在保证正确性的基础上大大减少了人工标注的工作量,同时可挖掘词语的内在语义含义,通过对分散的文本标签进行聚类,减少文本标签的类别数,增强数据的准确性,通过文本情感极性模型的引入,可以直观地对文本进行情感分类,并通过点评文本和标签文本的情感极性判断,完善点评文本和标签文本的匹配效果。