一种基于模式扩充及BERT分类的知识图谱上下位关系识别的方法和存储设备

基本信息

申请号 CN202011258408.0 申请日 -
公开(公告)号 CN112417161B 公开(公告)日 2022-06-24
申请公布号 CN112417161B 申请公布日 2022-06-24
分类号 G06F16/36;G06F40/295;G06N3/04 分类 计算;推算;计数;
发明人 苏江文;宋立华;王秋琳 申请(专利权)人 福建亿榕信息技术有限公司
代理机构 福州市景弘专利代理事务所(普通合伙) 代理人 魏小霞;林祥翔
地址 350000 福建省福州市鼓楼区软件大道89号G区20号楼
法律状态 -

摘要

摘要 本发明涉及文本识别技术领域,特别涉及一种基于模式扩充及BERT分类的知识图谱上下位关系识别的方法和存储设备。所述一种基于模式扩充及BERT分类的知识图谱上下位关系识别的方法,包括步骤:基于模式扩充从外部数据中抽取潜在的上下位关系对,并结合预设资源库形成上下位关系模型训练种子语料;获取待预测上下位关系数据集,基于BERT‑Attention‑Bi‑LSTM模型对待预测数据集进行预测,得上下位关系预测结果;通过预设规则对所述上下位关系预测结果进一步处理得最终的上下位关系预测结果。该方法大大降低了规则编制的复杂性及人工投入,同时相对于另外一种主流的基于统计的上下位概念识别方法,具备更强的可实现性,能为各类专业知识图谱的构建提供技术支撑。