智慧城市主题信息抽取方法、装置、电子设备和存储介质
基本信息
申请号 | CN202110642261.3 | 申请日 | - |
公开(公告)号 | CN113297373A | 公开(公告)日 | 2021-08-24 |
申请公布号 | CN113297373A | 申请公布日 | 2021-08-24 |
分类号 | G06F16/335(2019.01)I;G06F16/35(2019.01)I;G06F40/295(2020.01)I;G06F40/30(2020.01)I;G06F17/16(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 杨杨;于海涛;高志鹏;赵斌男;王臻;赵龙军;李恒;李良;冷超;高枫;陈奇柏 | 申请(专利权)人 | 中国雄安集团数字城市科技有限公司 |
代理机构 | 北京路浩知识产权代理有限公司 | 代理人 | 陈新生 |
地址 | 100876北京市海淀区西土城路10号北京邮电大学 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例提供一种智慧城市主题信息抽取方法、装置、电子设备和存储介质。该方法包括:将待抽取的智慧城市主题文本输入至预训练模型,输出智慧城市主题文本特征矩阵;基于文本特征矩阵,确定头实体位置特征矩阵和尾实体位置特征矩阵;其中,实体为被识别的目标单词,头实体位置特征矩阵和尾实体位置特征矩阵表示待抽取文本中单词与实体的相对位置关系;基于头实体位置特征矩阵和尾实体位置特征矩阵,确定面向智慧城市主题的简洁文本特征矩阵;基于简洁文本特征矩阵确定待抽取文本中的实体关系。本发明实施例通过将智慧城市主题的外部语料的绝对位置信息迁移至实体关系抽取具体任务,并通过降噪处理缓解噪声与误标注数据对模型参数更新的干扰,提升智慧城市知识图谱的实体关系抽取精度。 |
