非结构化数据处理方法及系统
基本信息
申请号 | CN201410054773.8 | 申请日 | - |
公开(公告)号 | CN103761337A | 公开(公告)日 | 2014-04-30 |
申请公布号 | CN103761337A | 申请公布日 | 2014-04-30 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 叶向维 | 申请(专利权)人 | 上海锦恩信息科技有限公司 |
代理机构 | 上海弼兴律师事务所 | 代理人 | 上海锦恩信息科技有限公司 |
地址 | 201308 上海市浦东新区芦潮港镇芦潮港路1758号1幢8326室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种非结构化数据处理方法及系统。该非结构化数据处理方法包括以下步骤:设置多个包括关键词的特征模板;分别使用各个特征模板扫描存储有多条非结构化数据的数据库,针对各条非结构化数据分别判断其中是否记载有和各个特征模板一致的内容,并将判断结果为是的特征模板作为各条非结构化数据匹配的特征模板记录;生成与该多条非结构化数据分别一一对应的多个模板向量,每个模板向量具有一一对应于该多个特征模板的多个维度。本发明的非结构化数据处理方法及系统,通过利用特征模板将非结构化数据处理成向量形式,使得后续的计算处理针对模板向量进行,降低了对于非结构化数据的数据分析所需要的计算资源和时间。 |
