基于本体词库的商品评论属性词抽取方法
基本信息
申请号 | CN201510138316.1 | 申请日 | - |
公开(公告)号 | CN104715049B | 公开(公告)日 | 2017-11-28 |
申请公布号 | CN104715049B | 申请公布日 | 2017-11-28 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 马睿;周晓锋;潘福成 | 申请(专利权)人 | 无锡中科泛在信息技术研发中心有限公司 |
代理机构 | 无锡市大为专利商标事务所(普通合伙) | 代理人 | 殷红梅;刘品超 |
地址 | 214135 江苏省无锡市新区菱湖大道200号中国传感网国际创新园C座 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种基于本体词库的商品评论属性词抽取方法,包括下述步骤:步骤1,对评论文本预处理:首先将每条评论文本分割为不同的子句;其次,对每条评论的各个子句,结合属性词本体词库,进行分词,然后进行词性标注,去停用词,接着在子句中搜索名词作为该条评论的属性词候选集;步骤2,对属性词候选集中的属性词进行归类:步骤3,在各个属性词候选集中,合并属性词的同义词类:步骤4,经过对属性词候选集中的合并操作之后,将每个同义词类的中心词认定为属性词候选集对应的子句的属性词。本发明相比于传统的文本处理提取属性词的方法效率更高。 |
