一种基于TransE模型的面向法律文本的知识表示学习方法

基本信息

申请号 CN202110058262.3 申请日 -
公开(公告)号 CN113312487A 公开(公告)日 2021-08-27
申请公布号 CN113312487A 申请公布日 2021-08-27
分类号 G06F16/36(2019.01)I;G06F40/242(2020.01)I;G06F40/295(2020.01)I;G06Q50/18(2012.01)I 分类 计算;推算;计数;
发明人 李参宏 申请(专利权)人 江苏网进科技股份有限公司
代理机构 苏州佳博知识产权代理事务所(普通合伙) 代理人 唐毅
地址 215300江苏省苏州市昆山市玉山镇登云路288号
法律状态 -

摘要

摘要 本发明公开一种基于TransE模型的面向法律文本的知识表示学习方法,该方法包括如下步骤:S1:利用掩码语言模型获取法律行业训练文本;S2:根据获取的所述法律行业训练文本,划分实体,提取实体间的对应关系,并以三元组的形式将定义好的数据存储到图数据库;S3:利用所述图数据库对训练文本中的行业词实体进行匹配,定义知识表示学习TransE模型的目标函数;通过融合训练文本中的实体向量与图数据库中的结构信息,对模型进行训练,学习实体向量和关系向量的表示。本发明解决了传统知识表示学习方法中只利用结构化信息,没有利用多种额外信息的问题,使得融合文本信息到的知识表示可以更好地表示知识库中的复杂关系。