基于本体词库的商品评论属性词抽取方法

基本信息

申请号 CN201510138316.1 申请日 -
公开(公告)号 CN104715049B 公开(公告)日 2017-11-28
申请公布号 CN104715049B 申请公布日 2017-11-28
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 马睿;周晓锋;潘福成 申请(专利权)人 无锡中科泛在信息技术研发中心有限公司
代理机构 无锡市大为专利商标事务所(普通合伙) 代理人 殷红梅;刘品超
地址 214135 江苏省无锡市新区菱湖大道200号中国传感网国际创新园C座
法律状态 -

摘要

摘要 本发明提供一种基于本体词库的商品评论属性词抽取方法,包括下述步骤:步骤1,对评论文本预处理:首先将每条评论文本分割为不同的子句;其次,对每条评论的各个子句,结合属性词本体词库,进行分词,然后进行词性标注,去停用词,接着在子句中搜索名词作为该条评论的属性词候选集;步骤2,对属性词候选集中的属性词进行归类:步骤3,在各个属性词候选集中,合并属性词的同义词类:步骤4,经过对属性词候选集中的合并操作之后,将每个同义词类的中心词认定为属性词候选集对应的子句的属性词。本发明相比于传统的文本处理提取属性词的方法效率更高。