一种实体标注方法及装置、服务器、存储介质

基本信息

申请号 CN202011301554.7 申请日 -
公开(公告)号 CN112328709A 公开(公告)日 2021-02-05
申请公布号 CN112328709A 申请公布日 2021-02-05
分类号 G06F16/28(2019.01)I;G06F16/29(2019.01)I 分类 计算;推算;计数;
发明人 黄佳洋;丘宇彬;陈枫;徐维黛;朱易文;陈清财;李东方;付冠宇 申请(专利权)人 深圳市图灵机器人有限公司
代理机构 广州三环专利商标代理有限公司 代理人 熊永强
地址 518000广东省深圳市南山区朗山路28号通产集团中科创客社区一楼
法律状态 -

摘要

摘要 本申请实施例公开了一种实体标注方法及装置、服务器、存储介质,包括:获取目标实体,目标实体包括目标实体名称和目标实体内容;根据目标实体名称和目标实体内容确定目标实体的实体类型;根据实体类型以及目标实体内容,在预设文档中确定至少一个候选实体内容的位置信息;根据至少一个候选实体内容的位置信息,在预设文档中确定每个候选实体内容的最近邻实体名称,计算待聚类集合中两两实体名称之间的置信度;根据两两实体名称之间的置信度,对待聚类集合中的每个实体名称进行聚类以得到第一聚类群;将第一聚类群中各最近邻实体名称所对应的候选实体内容的位置信息确定为目标实体内容的标注结果。采用本申请,可以提高实体标注质量。