一种实体标准化方法
基本信息
申请号 | CN202110598353.6 | 申请日 | - |
公开(公告)号 | CN113255353A | 公开(公告)日 | 2021-08-13 |
申请公布号 | CN113255353A | 申请公布日 | 2021-08-13 |
分类号 | G06F40/295;G06F40/237;G06F40/284;G06F16/951;G06F16/35;G06N3/04 | 分类 | 计算;推算;计数; |
发明人 | 曾志贤;马涛;倪斌;汪姿如;庄福振;安竹林 | 申请(专利权)人 | 中国科学院计算技术研究所厦门数据智能研究院 |
代理机构 | 安徽善安知识产权代理事务所(特殊普通合伙) | 代理人 | 陈庭 |
地址 | 361021 福建省厦门市集美区软件园三期凤岐路208-3号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种实体标准化方法,包括以下步骤:步骤一:建立标准实体词的知识库;步骤二:通过构建好的标准实体词的知识库,构建模型所需的训练数据;步骤三:利用构建好的训练数据分别训练实体分类模型以及实体匹配模型;步骤四:将待识别的实体输入候选实体生成模块,生成候选实体集合;步骤五:将候选实体集合中标准实体进行排序。本发明所述的一种实体标准化方法,相比于其他方法,不使用实体词的上下文信息,即能达到实体标准化的结果;通过添加实体的类型信息,作为实体匹配模型的一部分输入,就能有效的提高实体标准化的准确率,能较好的实现实体标准化任务。 |
