古籍专名识别方法以及装置

基本信息

申请号 CN201711012269.1 申请日 -
公开(公告)号 CN107704454A 公开(公告)日 2018-02-16
申请公布号 CN107704454A 申请公布日 2018-02-16
分类号 G06F17/27;G06F17/30 分类 计算;推算;计数;
发明人 干生洪;洪涛 申请(专利权)人 古联(北京)数字传媒科技有限公司
代理机构 北京超凡志成知识产权代理事务所(普通合伙) 代理人 古联(北京)数字传媒科技有限公司
地址 100000 北京市丰台区榆树庄1号北京国家数字出版基地B008
法律状态 -

摘要

摘要 本发明提供了一种古籍专名识别方法以及装置,通过获取古籍文本,基于古籍统计模型分词算法对所述古籍文本进行分词处理,得到多个专名;基于预先保存的专名知识库,对每个专名进行分类;针对每个专名,判断该专名是否是预先保存的专名知识库中的书名;若不是,针对每个专名,在判断该专名只属于分类类别中的一个类别时,将该专名保存为所述古籍文本的目标专名。该方法可以缓解传统的手工专名标注耗时耗力,传统的机器标注效果较差的问题。提高古籍专名识别的精度及质量,从而满足古籍整理出版工作中的实际应用需求。