一种实体标准化方法

基本信息

申请号 CN202110598353.6 申请日 -
公开(公告)号 CN113255353A 公开(公告)日 2021-08-13
申请公布号 CN113255353A 申请公布日 2021-08-13
分类号 G06F40/295;G06F40/237;G06F40/284;G06F16/951;G06F16/35;G06N3/04 分类 计算;推算;计数;
发明人 曾志贤;马涛;倪斌;汪姿如;庄福振;安竹林 申请(专利权)人 中国科学院计算技术研究所厦门数据智能研究院
代理机构 安徽善安知识产权代理事务所(特殊普通合伙) 代理人 陈庭
地址 361021 福建省厦门市集美区软件园三期凤岐路208-3号
法律状态 -

摘要

摘要 本发明公开了一种实体标准化方法,包括以下步骤:步骤一:建立标准实体词的知识库;步骤二:通过构建好的标准实体词的知识库,构建模型所需的训练数据;步骤三:利用构建好的训练数据分别训练实体分类模型以及实体匹配模型;步骤四:将待识别的实体输入候选实体生成模块,生成候选实体集合;步骤五:将候选实体集合中标准实体进行排序。本发明所述的一种实体标准化方法,相比于其他方法,不使用实体词的上下文信息,即能达到实体标准化的结果;通过添加实体的类型信息,作为实体匹配模型的一部分输入,就能有效的提高实体标准化的准确率,能较好的实现实体标准化任务。