一种基于意群划分的文本处理技术方法和系统
基本信息
申请号 | CN201810380737.9 | 申请日 | - |
公开(公告)号 | CN110399603A | 公开(公告)日 | 2019-11-01 |
申请公布号 | CN110399603A | 申请公布日 | 2019-11-01 |
分类号 | G06F17/27(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 杜登斌; 丁雨 | 申请(专利权)人 | 北京中润普达信息技术有限公司 |
代理机构 | 北京律诚同业知识产权代理有限公司 | 代理人 | 北京中润普达信息技术有限公司 |
地址 | 100029 北京市西城区北三环中路甲29号院华尊大厦B座6层605 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种基于意群划分的文本处理方法和系统,包括:获取待分析语义倾向性的文章,文章包括段落,段落包括句子,将句子划分成表达单一语义的连续语言片段,作为语义意群,将语义意群进行分词处理,得到候选词;获取由情感词词库,为词库中每个情感词分配倾向权重,构建情感词词表,在情感词词表中检索候选词,提取与候选词相对应的情感词作为句子的倾向词;通过分别分析倾向词前的程度副词和否定词,为倾向词赋予程度权重和否定权重将否定权重、程度权重、倾向词的倾向权重三者相乘得到语义意群的意群倾向分量,集合句子中每个意群的倾向分量,作为句子倾向分量,根据句子倾向分量,得到文章的语义倾向分量,作为文章的语义倾向性分析结果。 |
