基于地址树模型的中文地址提取方法

基本信息

申请号 CN202010216951.8 申请日 -
公开(公告)号 CN111444299A 公开(公告)日 2020-07-24
申请公布号 CN111444299A 申请公布日 2020-07-24
分类号 G06F16/29(2019.01)I 分类 -
发明人 张平;亢孟军;汪艳霞;叶蕾;刘越;曾伟东;陈建;黄磊;刘仁;林熹 申请(专利权)人 福州市勘测院有限公司
代理机构 福州元创专利商标代理有限公司 代理人 丘鸿超;蔡学俊
地址 350108福建省福州市闽侯县上街镇高新大道1号
法律状态 -

摘要

摘要 本发明提出一种基于地址树模型的中文地址提取方法,包括以下步骤:步骤S1:对地址字符串进行分词和识别,生成地址元素集合以及地址元素语义集合;步骤S2:建立根结点root,提取地址元素,遍历地址元素的语义集,构建地址语义结点,并依次连结到根节点;步骤S3:提取后续地址元素,遍历其语义结点;执行语义级别的比较和空间约束关系一致性判断,进行与叶子节点的连接或生成新的子树。