基于句法分析和聚类的三元组生成方法、装置及用户终端

基本信息

申请号 CN201711408501.3 申请日 -
公开(公告)号 CN108133014B 公开(公告)日 2022-03-22
申请公布号 CN108133014B 申请公布日 2022-03-22
分类号 G06F16/35(2019.01)I;G06F16/36(2019.01)I;G06F40/211(2020.01)I;G06F40/289(2020.01)I;G06Q30/02(2012.01)I 分类 计算;推算;计数;
发明人 牟昊;杨飞 申请(专利权)人 广州数说故事信息科技有限公司
代理机构 广州科捷知识产权代理事务所(普通合伙) 代理人 杨晶晶
地址 510623广东省广州市天河区黄埔大道西100号之一702房之五
法律状态 -

摘要

摘要 本发明公开了基于句法分析和聚类的三元组生成方法、装置及用户终端,方法包括:获取文本信息,清洗噪音并划分为句子;将句子划分为至少一个词语;按句子顺序将词语以及其对应的词性作为输入,构建句法依赖树;将句法依赖树转换为无向图,利用宽度搜索技术生成二元组,二元组表达为(特征词,情感词);获取二元组中的特征词,将特征词转换为特征向量;将特征向量作为输入,通过K‑Means算法进行聚类,使特征词聚类为对应的类别;获取对应的类别的ID,记为类别ID,输出三元组,三元组表达为(类别ID,特征词,情感词)。本发明的优点在于通过句法分析发现二元组,通过特征词聚类,将类似的特征词聚在一起,同时降低了人工成本。