一种基于统计分词的文献密级甄别方法

基本信息

申请号 CN202010530243.1 申请日 -
公开(公告)号 CN111767733A 公开(公告)日 2020-10-13
申请公布号 CN111767733A 申请公布日 2020-10-13
分类号 G06F40/295(2020.01)I;G06F40/30(2020.01)I 分类 计算;推算;计数;
发明人 李强;余祥;朱峰;李腾飞;陈立哲;顾正海 申请(专利权)人 安徽旅贲科技有限公司
代理机构 合肥天明专利事务所(普通合伙) 代理人 安徽旅贲科技有限公司
地址 230000安徽省合肥市高新区华佗巷103号国科军通协同创新产业园A座212
法律状态 -

摘要

摘要 本发明公开了一种基于统计分词的文献密级甄别方法,属于信息安全技术领域,包括:对电子文件中的文字内容进行提取,得到对应的文档内容;将文档内容与预先构建的敏感信息库中的敏感信息进行语义相似度计算;根据语义相似度计算电子文件的内容涉密程度,得到电子文件的密级判定结果。本发明通过提取电子文件的内容,并与敏感信息库中的敏感信息进行比对,找到文档中的疑似涉密信息,对电子文件是否涉密进行判定,以辅助人工对电子文件进行密级甄别,便于对文献实施分类管理。