古籍书名识别方法以及装置

基本信息

申请号 CN201711177794.9 申请日 -
公开(公告)号 CN107832303A 公开(公告)日 2018-03-23
申请公布号 CN107832303A 申请公布日 2018-03-23
分类号 G06F17/27;G06F17/30 分类 计算;推算;计数;
发明人 洪涛;干生洪 申请(专利权)人 古联(北京)数字传媒科技有限公司
代理机构 北京超凡志成知识产权代理事务所(普通合伙) 代理人 古联(北京)数字传媒科技有限公司
地址 100000 北京市丰台区榆树庄1号北京国家数字出版基地B008
法律状态 -

摘要

摘要 本发明提供了一种古籍书名识别方法以及装置,通过获取古籍文本,基于古籍统计模型分词算法对所述古籍文本进行分词处理,得到多个分词;基于预先保存的书名知识库,对每个分词进行分类,其中,分类类别包括:书名、篇名、乐舞名、书名简称、篇名简称以及含人名书名;针对每个分词,在判断该分词只属于分类类别中的一个类别时,将该分词保存为所述古籍文本的目标书名。该方法可以缓解传统的手工书名标注耗时耗力,传统的机器标注效果较差的问题。提高古籍书名识别的精度及质量,从而满足古籍整理出版工作中的实际应用需求。