一种基于SQL的文本数据统计实现方法
基本信息
申请号 | CN201510657159.5 | 申请日 | - |
公开(公告)号 | CN105335479B | 公开(公告)日 | 2018-11-23 |
申请公布号 | CN105335479B | 申请公布日 | 2018-11-23 |
分类号 | G06F17/30 | 分类 | 计算;推算;计数; |
发明人 | 王洋;蒋旭;陈训逊;赵殿奎;吴震;谭炜波;赵旭;李晓鹏 | 申请(专利权)人 | 天津神舟通用数据技术有限公司 |
代理机构 | 天津盛理知识产权代理有限公司 | 代理人 | 国家计算机网络与信息安全管理中心;天津神舟通用数据技术有限公司 |
地址 | 100029 北京市朝阳区裕民路甲3号 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种基于SQL的文本数据统计实现方法,其技术特点是:对输入SQL语法进行解析;在结构化数据仓库中建立和子查询投影结构一致的临时表;识别全文索引引擎数据分布规则;将基于SQL的简单子查询翻译为全文索引引擎语法,并在全文索引引擎中执行;获取全文索引查询结果并将结果导入到结构化数据仓库引擎临时表中;完成查询结果导入过程,向数据仓库下发重写后的基于临时表SQL查询语句,并向客户端返回查询结果。本发明结合全文索引引擎和结构化数据仓库引擎的特点,实现对海量文本数据的基于通用SQL语言的统计分析方法,解决了传统方法统计功能薄弱和结构化数据仓库无法支持高效文本检索的问题,大大提高了文本数据统计分析的易用性。 |
