基于文本分析处理通信质量投诉地址的方法及系统

基本信息

申请号 CN202010114162.3 申请日 -
公开(公告)号 CN111353309A 公开(公告)日 2020-06-30
申请公布号 CN111353309A 申请公布日 2020-06-30
分类号 G06F40/295(2020.01)I 分类 -
发明人 刘德厚;雷晓宇;王福君;李言良 申请(专利权)人 北京合力亿捷科技股份有限公司
代理机构 北京久诚知识产权代理事务所(特殊普通合伙) 代理人 北京合力亿捷科技股份有限公司
地址 100081北京市海淀区中关村南大街甲12号寰太大厦18层
法律状态 -

摘要

摘要 基于文本分析处理通信质量投诉地址的方法及系统,包括:通过正向最长匹配算法对源文本进行中文地址分词;分词结果由多级行政区划地址树推理分析,得到精确的多级地名识别结果;接收到地址树传递的输入后,基于规则的多级地址识别算法,自动分析出更复杂更一般的多级地址字段;将地址树的推理结果和规则匹配的识别结果融合,作为算法系统的最终输出。针对通信质量投诉工单具体受理文本内容,进行中文分词、正则表达式地址抽取以及地址树推理处理后,实现通信质量投诉工单标准地址的自动抽取。