基于地址树模型的中文地址提取方法
基本信息
申请号 | CN202010216951.8 | 申请日 | - |
公开(公告)号 | CN111444299A | 公开(公告)日 | 2020-07-24 |
申请公布号 | CN111444299A | 申请公布日 | 2020-07-24 |
分类号 | G06F16/29(2019.01)I | 分类 | - |
发明人 | 张平;亢孟军;汪艳霞;叶蕾;刘越;曾伟东;陈建;黄磊;刘仁;林熹 | 申请(专利权)人 | 福州市勘测院有限公司 |
代理机构 | 福州元创专利商标代理有限公司 | 代理人 | 丘鸿超;蔡学俊 |
地址 | 350108福建省福州市闽侯县上街镇高新大道1号 | ||
法律状态 | - |
摘要
摘要 | 本发明提出一种基于地址树模型的中文地址提取方法,包括以下步骤:步骤S1:对地址字符串进行分词和识别,生成地址元素集合以及地址元素语义集合;步骤S2:建立根结点root,提取地址元素,遍历地址元素的语义集,构建地址语义结点,并依次连结到根节点;步骤S3:提取后续地址元素,遍历其语义结点;执行语义级别的比较和空间约束关系一致性判断,进行与叶子节点的连接或生成新的子树。 |
