一种基于文本挖掘的金融类逾期短信智能判别方法
基本信息
申请号 | CN201610951973.2 | 申请日 | - |
公开(公告)号 | CN106547738B | 公开(公告)日 | 2019-05-07 |
申请公布号 | CN106547738B | 申请公布日 | 2019-05-07 |
分类号 | G06F17/27(2006.01)I; G06Q40/02(2012.01)I | 分类 | 计算;推算;计数; |
发明人 | 邱峰; 张满才 | 申请(专利权)人 | 北京亿美软通科技有限公司 |
代理机构 | 北京永创新实专利事务所 | 代理人 | 北京亿美软通科技有限公司 |
地址 | 100025 北京市朝阳区四惠东通惠河畔创意文化产业园1131号君天大厦6层 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于文本挖掘的金融类逾期短信智能判别方法,属于文本数据挖掘领域。本发明方法主要包括:获取短信文本进行分词,计算短信文本的相似度,提取短信模板;对短信模板抽样标注是否为金融逾期短信;对所有短信模板进行分词,挖掘新词和领域词组,形成新词库;用新词库对短信模板重新分词,提取对逾期判别具有重要价值的分词,组成特征向量空间;将标注的短信模板作为训练数据,采用支持向量机算法训练金融逾期分类器模型,训练好后输入所有短信,进行逾期分类判别。采用本发明方法,可以快速地从大量短信文本中提取金融逾期类相关的短信,从而为个人征信业务提供重要参考价值。 |
