一种突发事件检测方法及装置

基本信息

申请号 CN202111120270.2 申请日 -
公开(公告)号 CN113836267A 公开(公告)日 2021-12-24
申请公布号 CN113836267A 申请公布日 2021-12-24
分类号 G06F16/33(2019.01)I;G06F16/335(2019.01)I;G06F16/35(2019.01)I;G06F40/284(2020.01)I 分类 计算;推算;计数;
发明人 张君维;丰苏;马志远;李静;王欢;王庆春;于大东;郭爽 申请(专利权)人 国家市场监督管理总局信息中心
代理机构 北京集佳知识产权代理有限公司 代理人 刘乐
地址 100088北京市海淀区马甸东路9号
法律状态 -

摘要

摘要 本申请公开了一种突发事件检测方法及装置,方法包括:对新闻数据集进行第一处理,得到预处理数据集和对应的词频数据集,预处理器数据集中包含多个实词词语,词频数据集中包含实词词语的出现次数;基于预处理数据集、词频数据集以及实词词语所属新闻的展示信息确定各个实词词语的突发性,并将突发性满足第一条件的实词词语确定为突发词;对多个突发词组成的突发词集进行基于词语共现性的相似度计算,构建所述多个突发词之间的相似度矩阵;对相似度矩阵进行聚类处理,并基于聚类结果确定突发事件。上述实现方案将新闻数据特征与词语自身特征结合来计算突发性,能够有效提高提取突发词的准确度,从而整体上提升突发事件检测结果的准确性。