一种提取汽车口碑词云所需数据的方法及装置
基本信息

| 申请号 | CN202010769089.3 | 申请日 | - |
| 公开(公告)号 | CN111859962B | 公开(公告)日 | 2021-06-08 |
| 申请公布号 | CN111859962B | 申请公布日 | 2021-06-08 |
| 分类号 | G06F40/289;G06F16/35;G06F40/242;G06F40/216 | 分类 | 计算;推算;计数; |
| 发明人 | 陈晶;李奏换;卢春霞;黎秋怡;刘丹;梁维新 | 申请(专利权)人 | 广州威尔森信息科技有限公司 |
| 代理机构 | 深圳市智胜联合知识产权代理有限公司 | 代理人 | 齐文剑 |
| 地址 | 510000 广东省广州市天河区珠江东路12号1201房之全层 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明涉及大数据技术领域,特别是涉及一种提取汽车口碑词云所需数据的方法,包括:获取汽车口碑评论相关数据;对获取的数据进行数据筛选;所述数据筛选包括选取需要的数据,并对需要的数据使用统一命名规则;对所述需要的数据进行分词,并对评论属性进行类别判定;使用多线程处理,并对每条评论构建关键词图;按维度获取关键词短语,并进行相关处理,对处理后的结果进行展示。只显示我们需要的汽车配置项的相关描述,过滤了其他非相关描述。提取的关键词不仅考虑了词频,在每个类别下的显著性,还考虑关键短语中组合词之间的窗口影响,不需要事先对多篇文档进行学习训练,因其简洁有效而得到广泛应用。 |





