一种提取汽车口碑词云所需数据的方法及装置

基本信息

申请号 CN202010769089.3 申请日 -
公开(公告)号 CN111859962A 公开(公告)日 2021-06-08
申请公布号 CN111859962A 申请公布日 2021-06-08
分类号 G06F40/289;G06F16/35;G06F40/242;G06F40/216 分类 计算;推算;计数;
发明人 陈晶;李奏换;卢春霞;黎秋怡;刘丹;梁维新 申请(专利权)人 广州威尔森信息科技有限公司
代理机构 深圳市智胜联合知识产权代理有限公司 代理人 齐文剑
地址 510000 广东省广州市天河区珠江东路12号1201房之全层
法律状态 -

摘要

摘要 本发明涉及大数据技术领域,特别是涉及一种提取汽车口碑词云所需数据的方法,包括:获取汽车口碑评论相关数据;对获取的数据进行数据筛选;所述数据筛选包括选取需要的数据,并对需要的数据使用统一命名规则;对所述需要的数据进行分词,并对评论属性进行类别判定;使用多线程处理,并对每条评论构建关键词图;按维度获取关键词短语,并进行相关处理,对处理后的结果进行展示。只显示我们需要的汽车配置项的相关描述,过滤了其他非相关描述。提取的关键词不仅考虑了词频,在每个类别下的显著性,还考虑关键短语中组合词之间的窗口影响,不需要事先对多篇文档进行学习训练,因其简洁有效而得到广泛应用。