基于句法分析和聚类的三元组生成方法、装置及用户终端
基本信息
申请号 | CN201711408501.3 | 申请日 | - |
公开(公告)号 | CN108133014B | 公开(公告)日 | 2022-03-22 |
申请公布号 | CN108133014B | 申请公布日 | 2022-03-22 |
分类号 | G06F16/35(2019.01)I;G06F16/36(2019.01)I;G06F40/211(2020.01)I;G06F40/289(2020.01)I;G06Q30/02(2012.01)I | 分类 | 计算;推算;计数; |
发明人 | 牟昊;杨飞 | 申请(专利权)人 | 广州数说故事信息科技有限公司 |
代理机构 | 广州科捷知识产权代理事务所(普通合伙) | 代理人 | 杨晶晶 |
地址 | 510623广东省广州市天河区黄埔大道西100号之一702房之五 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了基于句法分析和聚类的三元组生成方法、装置及用户终端,方法包括:获取文本信息,清洗噪音并划分为句子;将句子划分为至少一个词语;按句子顺序将词语以及其对应的词性作为输入,构建句法依赖树;将句法依赖树转换为无向图,利用宽度搜索技术生成二元组,二元组表达为(特征词,情感词);获取二元组中的特征词,将特征词转换为特征向量;将特征向量作为输入,通过K‑Means算法进行聚类,使特征词聚类为对应的类别;获取对应的类别的ID,记为类别ID,输出三元组,三元组表达为(类别ID,特征词,情感词)。本发明的优点在于通过句法分析发现二元组,通过特征词聚类,将类似的特征词聚在一起,同时降低了人工成本。 |
