基于机器学习的招聘信息解析系统及其方法

基本信息

申请号 CN201610251667.8 申请日 -
公开(公告)号 CN105868968A 公开(公告)日 2016-08-17
申请公布号 CN105868968A 申请公布日 2016-08-17
分类号 G06Q10/10(2012.01)I;G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 杨洋;杨雪峰;赵泛舟;李训耕 申请(专利权)人 广州爱拼信息科技有限公司
代理机构 - 代理人 -
地址 510000 广东省广州市天河区华夏路26号12楼全层房自编D13房
法律状态 -

摘要

摘要 本发明涉及基于机器学习的招聘信息解析系统及其方法,解析系统包括数据采集模型和机器学习模型;所述数据采集模型爬取互联网招聘网站的不规则的招聘网页信息进行解析并生成训练数据;机器学习模型包括单信息源模型以及处理各类信息源的综合模型,单信息源模型是由训练数据中的单信息源模块分类数据训练所得,综合模型是由训练数据中的综合信息详细分类数据训练所得,互联网招聘网站、数据采集模型与机器学习模型连接,所采用的机器学习模型为条件随机场模型。招聘网页信息经过分析后得到训练数据后详细分类,采用机器学习模型中的条件随机场模型来对招聘信息中的具体语句块与短语进行分类标注,处理正则表达式不能匹配的数据,有效处理复杂或者新型职位的招聘信息解析与分析问题。