一种精简电子书字库的方法及电子书处理装置
基本信息
申请号 | CN201210348094.2 | 申请日 | - |
公开(公告)号 | CN102880690A | 公开(公告)日 | 2013-01-16 |
申请公布号 | CN102880690A | 申请公布日 | 2013-01-16 |
分类号 | G06F17/30(2006.01)I;G06F17/27(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 闻申生 | 申请(专利权)人 | 北京汉仪创新科技股份有限公司 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 王宝筠 |
地址 | 100036 北京市海淀区翠微路2号中国印刷科学技术研究所A座 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例公开了一种精简电子书字库的方法及电子书处理装置,其中所述方法包括:通过解析电子书的格式描述文件获取所述格式描述文件中的汉字内码,并按指定编码顺序排序,形成所述格式描述文件的码位顺序表;根据所述码位顺序表和所述电子书的原字库文件,通过只索引所述格式描述文件中出现的汉字内码的方式生成新字库文件;用所述新字库文件替换所述原字库文件,以完成电子书字库的精简。本发明实施例通过获取一本电子书的汉字内码序列,并以此生成该电子书专用的字形字库的方法,将该电子书用不到的字形滤掉,解决了电子书汉字字库的数据冗余问题,使得电子书字库文件大幅降低。 |
