一种公文头抽取方法、系统、装置及存储介质
基本信息
申请号 | CN202110344640.4 | 申请日 | - |
公开(公告)号 | CN113095061A | 公开(公告)日 | 2021-07-09 |
申请公布号 | CN113095061A | 申请公布日 | 2021-07-09 |
分类号 | G06F40/205(2020.01)I;G06F40/226(2020.01)I;G06F40/232(2020.01)I;G06F40/284(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 蓝建敏;李观春 | 申请(专利权)人 | 京华信息科技股份有限公司 |
代理机构 | 广州嘉权专利商标事务所有限公司 | 代理人 | 常柯阳 |
地址 | 510520广东省广州市天河区高普路138号京华信息大楼中座 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于隐马尔可夫模型的公文头抽取方法、系统、装置及存储介质;所述抽取方法包括获取公文文本,所述公文文本包括公文标题、公文体裁和公文内容;利用训练好的隐马尔可夫模型对所述公文文本进行公文头抽取;获取所述训练好的隐马尔可夫模型输出的公文头。本发明通过利用训练好的隐马尔可夫模型对所述公文文本进行公文头抽取,能够降低人工学习成本,提高公文头抽取精准度;同时能够自动对公文头中存在的错误进行修订。本发明可广泛应用于公文头抽取技术领域。 |
