一种基于文本的信息抽取方法和电子设备
基本信息
申请号 | CN202010759112.0 | 申请日 | - |
公开(公告)号 | CN112000767A | 公开(公告)日 | 2020-11-27 |
申请公布号 | CN112000767A | 申请公布日 | 2020-11-27 |
分类号 | G06F16/33(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 杨志明 | 申请(专利权)人 | 深思考人工智能科技(上海)有限公司 |
代理机构 | 北京德琦知识产权代理有限公司 | 代理人 | 深思考人工智能科技(上海)有限公司 |
地址 | 201210上海市浦东新区南汇新城镇环湖西二路888号C楼 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种基于文本的信息抽取方法和电子设备,包括:对于文本中的每一行语句Li,对该行语句Li进行纠错处理后,确定纠错后的语句与预设知识库中每条信息的相似度,并根据所述相似度,确定该行语句Li对应的所述信息的候选集合;根据所述候选集合中每条信息对应的所述相似度以及与该行语句Li之间的长度差,按照相似度优先的原则,确定所述候选集合中与该行语句Li相匹配的信息。应用本申请公开的技术方案,能够自动、准确地从文本中提取出预设信息。 |
