文件统计方法和文件统计系统

基本信息

申请号 CN201510925466.7 申请日 -
公开(公告)号 CN105512306B 公开(公告)日 2020-04-07
申请公布号 CN105512306B 申请公布日 2020-04-07
分类号 G06F16/17;G06F16/182;G06F16/18 分类 计算;推算;计数;
发明人 梁敬彪;李跃红;刘文娇;徐珂 申请(专利权)人 北京世界星辉科技有限责任公司
代理机构 北京华沛德权律师事务所 代理人 房德权
地址 100043 北京市石景山区西井路17号2号楼2层201室
法律状态 -

摘要

摘要 本发明公开了一种文件统计方法和文件统计系统。该文件统计方法包括:从文本文件中抽取一个或多个文件片段,其中,一个或多个文件片段中的每一个文件片段具有特定数据量;检测一个或多个文件片段中的每一个文件片段的行数;根据一个或多个文件片段中的每一个文件片段的行数计算具有特定数据量的文件片段的平均行数;以及根据具有特定数据量的文件片段的平均行数和文本文件的数据量估计文本文件的行数。根据本发明提供的文件统计方法和文件统计系统,采用抽样方式确定文本文件中的具有特定数据量的文件片段的平均行数,并进一步基于该平均行数估计整个文本文件的行数,这种方式简单高效、成本低,可以较准确地估计出整个文本文件的行数。