古籍书名识别方法以及装置
基本信息
申请号 | CN201711177794.9 | 申请日 | - |
公开(公告)号 | CN107832303A | 公开(公告)日 | 2018-03-23 |
申请公布号 | CN107832303A | 申请公布日 | 2018-03-23 |
分类号 | G06F17/27;G06F17/30 | 分类 | 计算;推算;计数; |
发明人 | 洪涛;干生洪 | 申请(专利权)人 | 古联(北京)数字传媒科技有限公司 |
代理机构 | 北京超凡志成知识产权代理事务所(普通合伙) | 代理人 | 古联(北京)数字传媒科技有限公司 |
地址 | 100000 北京市丰台区榆树庄1号北京国家数字出版基地B008 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种古籍书名识别方法以及装置,通过获取古籍文本,基于古籍统计模型分词算法对所述古籍文本进行分词处理,得到多个分词;基于预先保存的书名知识库,对每个分词进行分类,其中,分类类别包括:书名、篇名、乐舞名、书名简称、篇名简称以及含人名书名;针对每个分词,在判断该分词只属于分类类别中的一个类别时,将该分词保存为所述古籍文本的目标书名。该方法可以缓解传统的手工书名标注耗时耗力,传统的机器标注效果较差的问题。提高古籍书名识别的精度及质量,从而满足古籍整理出版工作中的实际应用需求。 |
