一种基于文本的信息抽取方法和电子设备

基本信息

申请号 CN202010759112.0 申请日 -
公开(公告)号 CN112000767A 公开(公告)日 2020-11-27
申请公布号 CN112000767A 申请公布日 2020-11-27
分类号 G06F16/33(2019.01)I 分类 计算;推算;计数;
发明人 杨志明 申请(专利权)人 深思考人工智能科技(上海)有限公司
代理机构 北京德琦知识产权代理有限公司 代理人 深思考人工智能科技(上海)有限公司
地址 201210上海市浦东新区南汇新城镇环湖西二路888号C楼
法律状态 -

摘要

摘要 本申请公开了一种基于文本的信息抽取方法和电子设备,包括:对于文本中的每一行语句Li,对该行语句Li进行纠错处理后,确定纠错后的语句与预设知识库中每条信息的相似度,并根据所述相似度,确定该行语句Li对应的所述信息的候选集合;根据所述候选集合中每条信息对应的所述相似度以及与该行语句Li之间的长度差,按照相似度优先的原则,确定所述候选集合中与该行语句Li相匹配的信息。应用本申请公开的技术方案,能够自动、准确地从文本中提取出预设信息。