基于网页信息的简历识别方法和装置
基本信息
申请号 | CN202011237984.7 | 申请日 | - |
公开(公告)号 | CN112966068A | 公开(公告)日 | 2021-06-15 |
申请公布号 | CN112966068A | 申请公布日 | 2021-06-15 |
分类号 | G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/126(2020.01)I;G06F40/211(2020.01)I;G06F40/216(2020.01)I;G06F40/242(2020.01)I;G06F40/295(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06Q10/10(2012.01)I;G06K9/62(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 徐震宇;马军峰;张雅婷;蔡如昕 | 申请(专利权)人 | 袭明科技(广东)有限公司 |
代理机构 | 广州市专注鱼专利代理有限公司 | 代理人 | 凌霄汉 |
地址 | 523808广东省东莞市松山湖园区科汇路1号1栋1901室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种基于网页信息的简历识别方法、装置、计算机设备和存储介质,上述基于网页信息的简历识别方法通过从网页界面提取网页文本信息,识别各个网页文本信息的命名体,得到各个网页文本信息分别对应的一组命名体,采用jieba分词器根据各组命名体对各个网页文本信息进行中文分词,得到各个网页文本信息分别对应的一组单元词,根据各组单元词确定各个网页文本信息的一组特征值,将各组特征值输入预先训练的文本分类模型,将各个网页文本信息划分为简历数据和非简历数据,以实现对网页界面中简历数据的准确识别,可以提高识别准确率。 |
