基于社交媒体图表示模型的社会风险事件抽取方法

基本信息

申请号 CN201610438133.6 申请日 -
公开(公告)号 CN105956197A 公开(公告)日 2016-09-21
申请公布号 CN105956197A 申请公布日 2016-09-21
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 凌立刚;朱海鹏 申请(专利权)人 杭州量知数据科技有限公司
代理机构 杭州求是专利事务所有限公司 代理人 杭州量知数据科技有限公司
地址 310000 浙江省杭州市西湖区西溪路525号C楼492室
法律状态 -

摘要

摘要 本发明公开了一种基于社交媒体图表示模型的社会风险事件抽取的方法。包括如下步骤:1)采用HCCG模型对事件建模,定义实体关系生成规则,刻画事件属性,利用词级别与流级别的上下文对事件进行多粒度抽取;2)根据被抽取事件的HCCG图,利用最大公共子图和最小公共超图的信息量之比进行相似度计算;3)通过社交媒体的上下文信息对HCCG进行增量式聚类,在聚类过程中逐渐突出新闻的事件要素;4)通过基于HCCG模型的聚类结果进行事件判别,判断聚类结果是否为真正的事件。本发明能有效地汇聚分散的社交媒体信息,直观地用实体关系模型多粒度地表达中间和最终的事件探测结果,相比传统的社交媒体事件抽取方法有更强的泛化应用能力以及更高的精确性。