对文档管理系统中的文档集合进行分类的方法以及系统

基本信息

申请号 CN201110427970.6 申请日 -
公开(公告)号 CN102591920A 公开(公告)日 2012-07-18
申请公布号 CN102591920A 申请公布日 2012-07-18
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 刘松涛 申请(专利权)人 北京经舆典网络科技有限公司
代理机构 北京汉昊知识产权代理事务所(普通合伙) 代理人 冯谱
地址 100078 北京市丰台区芳古园一区17楼1门1105号
法律状态 -

摘要

摘要 本发明提供了一种对文档管理系统中的文档集合进行分类的方法,该方法包括:分析所述文档集合,从该文档集合中的每一文档内抽取特征值,并根据该特征值生成特征标签,每一所述特征标签对应所述文档集合中的一个或多个文档;选取所述文档集合的全集或非空子集;构建条件模型,该条件模型包括多个类别,每一所述类别关联一个或多个所述特征标签以及包括该一个或多个特征标签在所述全集或非空子集内对应的全部或部分文档;根据所述条件模型对所述全集或非空子集中包括的文档进行分类。相应地,本发明还提供了一种对文档管理系统中的文档集合进行分类的系统。实施本发明可以降低文档分类的时间复杂度以及实现对大量文档按照任意需求进行多维度分类管理。