一种基于BERT类模型的阅读理解式新闻文本事件抽取方法
基本信息
申请号 | CN202011501132.4 | 申请日 | - |
公开(公告)号 | CN112612885A | 公开(公告)日 | 2021-04-06 |
申请公布号 | CN112612885A | 申请公布日 | 2021-04-06 |
分类号 | G06K9/62(2006.01)I;G06F16/34(2019.01)I;G06F16/35(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 贾宇;郭先会;张明亮;董弋粲;蒋彧忱;沈宜 | 申请(专利权)人 | 成都三零凯天通信实业有限公司 |
代理机构 | 成都九鼎天元知识产权代理有限公司 | 代理人 | 徐静 |
地址 | 610041四川省成都市高新区云华路333号1栋5单元4至8层 | ||
法律状态 | - |
摘要
摘要 | 本发明提供的一种基于BERT类模型的阅读理解式新闻文本事件抽取方法包括:收集中文新闻文本语料,并获得事件类型表和论元表;将事件类型表和论元表排序;根据论元表设计不同问题;划分训练集、验证集和测试集;标注标训练集和验证集;利用训练集和验证集输入BERT类模型进行训练和验证,分别得到事件类型多分类模型、问题有无答案的二分类模型以及论元抽取模型;使用事件类型多分类模型、问题有无答案的二分类模型以及论元抽取模型对测试集做预测,得到测试集的事件类型以及对应的论元抽取的预测结果。本发明将事件抽取任务转化为机器阅读理解任务,提高了事件抽取的准确性,并且能够根据不同的需求设计不同的事件类型以及关注的论元,泛化能力强。 |
