一种基于端到端模型训练的智能地址识别方法及装置

基本信息

申请号 CN202011241374.4 申请日 -
公开(公告)号 CN112329470A 公开(公告)日 2021-02-05
申请公布号 CN112329470A 申请公布日 2021-02-05
分类号 G06F40/295(2020.01)I; 分类 计算;推算;计数;
发明人 蒋永余;孔庆超;张佳旭;王宇琪;赵菲菲;吴晓飞;彭鑫;奉凡;罗引;王磊 申请(专利权)人 深圳中科闻歌科技有限公司
代理机构 北京华夏泰和知识产权代理有限公司 代理人 杜欣;吴雪
地址 100028北京市海淀区北四环西路9号楼银谷大厦7层0715室
法律状态 -

摘要

摘要 本申请提供了一种基于端到端模型训练的智能地址识别方法及装置,属于计算机技术领域。本申请通过获取训练数据集,所述训练数据集包括多个地址文本数据及每个所述地址文本数据对应的验证数据;针对每个地址文本数据,生成所述地址文本数据对应的字符嵌入向量序列;将所述字符嵌入向量序列输入至第一级子模型;将每一级子模型的输出数据与所述验证数据比较,得到多个误差;根据所述多个误差调整所述地址文本识别模型的参数,直至所述地址文本识别模型收敛时,训练结束。通过本申请,可以将多个级联的子模型产生的多个误差,作为依据以调整地址文本识别模型的参数,减少多个级联子模型的整体误差,避免了多个子模型之间的误差累积。