古籍专名识别方法以及装置
基本信息
申请号 | CN201711012269.1 | 申请日 | - |
公开(公告)号 | CN107704454A | 公开(公告)日 | 2018-02-16 |
申请公布号 | CN107704454A | 申请公布日 | 2018-02-16 |
分类号 | G06F17/27;G06F17/30 | 分类 | 计算;推算;计数; |
发明人 | 干生洪;洪涛 | 申请(专利权)人 | 古联(北京)数字传媒科技有限公司 |
代理机构 | 北京超凡志成知识产权代理事务所(普通合伙) | 代理人 | 古联(北京)数字传媒科技有限公司 |
地址 | 100000 北京市丰台区榆树庄1号北京国家数字出版基地B008 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种古籍专名识别方法以及装置,通过获取古籍文本,基于古籍统计模型分词算法对所述古籍文本进行分词处理,得到多个专名;基于预先保存的专名知识库,对每个专名进行分类;针对每个专名,判断该专名是否是预先保存的专名知识库中的书名;若不是,针对每个专名,在判断该专名只属于分类类别中的一个类别时,将该专名保存为所述古籍文本的目标专名。该方法可以缓解传统的手工专名标注耗时耗力,传统的机器标注效果较差的问题。提高古籍专名识别的精度及质量,从而满足古籍整理出版工作中的实际应用需求。 |
