网页简历页面的信息抽取方法和装置

基本信息

申请号 CN202011237959.9 申请日 -
公开(公告)号 CN112948536A 公开(公告)日 2021-06-11
申请公布号 CN112948536A 申请公布日 2021-06-11
分类号 G06F16/33;G06F40/126;G06F40/211;G06F40/216;G06F40/242;G06F40/295;G06N3/04;G06N3/08;G06Q10/10 分类 计算;推算;计数;
发明人 徐震宇;马军峰;张雅婷;蔡如昕 申请(专利权)人 袭明科技(广东)有限公司
代理机构 广州市专注鱼专利代理有限公司 代理人 凌霄汉
地址 523808广东省东莞市松山湖园区科汇路1号1栋1901室
法律状态 -

摘要

摘要 本发明涉及一种网页简历页面的信息抽取方法、装置、计算机设备和存储介质,上述网页简历页面的信息抽取方法通过从网页简历页面提取简历文本信息,对各个简历文本信息进行中文分词,得到各个简历文本信息分别对应的一组单元词,设置用于描述个人简历的多个三元组,根据各组单元词确定各个简历文本信息的一组特征值向量,分别在各组特征值向量中提取各个三元组的内容,根据各个三元组的内容确定简历信息,以实现所需简历信息的准确提取,可以提高简历信息的抽取效率。