一种基于BERT类模型的阅读理解式新闻文本事件抽取方法

基本信息

申请号 CN202011501132.4 申请日 -
公开(公告)号 CN112612885A 公开(公告)日 2021-04-06
申请公布号 CN112612885A 申请公布日 2021-04-06
分类号 G06K9/62(2006.01)I;G06F16/34(2019.01)I;G06F16/35(2019.01)I 分类 计算;推算;计数;
发明人 贾宇;郭先会;张明亮;董弋粲;蒋彧忱;沈宜 申请(专利权)人 成都三零凯天通信实业有限公司
代理机构 成都九鼎天元知识产权代理有限公司 代理人 徐静
地址 610041四川省成都市高新区云华路333号1栋5单元4至8层
法律状态 -

摘要

摘要 本发明提供的一种基于BERT类模型的阅读理解式新闻文本事件抽取方法包括:收集中文新闻文本语料,并获得事件类型表和论元表;将事件类型表和论元表排序;根据论元表设计不同问题;划分训练集、验证集和测试集;标注标训练集和验证集;利用训练集和验证集输入BERT类模型进行训练和验证,分别得到事件类型多分类模型、问题有无答案的二分类模型以及论元抽取模型;使用事件类型多分类模型、问题有无答案的二分类模型以及论元抽取模型对测试集做预测,得到测试集的事件类型以及对应的论元抽取的预测结果。本发明将事件抽取任务转化为机器阅读理解任务,提高了事件抽取的准确性,并且能够根据不同的需求设计不同的事件类型以及关注的论元,泛化能力强。