基于深度学习的简历信息结构化方法及系统

基本信息

申请号 CN202110624203.8 申请日 -
公开(公告)号 CN113220768A 公开(公告)日 2021-08-06
申请公布号 CN113220768A 申请公布日 2021-08-06
分类号 G06F16/25;G06F16/28;G06F40/211;G06F40/30;G06K9/62;G06N20/00 分类 计算;推算;计数;
发明人 秦琨;王俊 申请(专利权)人 杭州投知信息技术有限公司
代理机构 北京汇信合知识产权代理有限公司 代理人 卢亮辉
地址 311100 浙江省杭州市余杭区五常街道文一西路998号5幢602室
法律状态 -

摘要

摘要 本发明公开了一种基于深度学习的简历信息结构化方法及系统,方法包括:获取简历电子文档并进行解析,获得简历文本,并对简历文本进行预处理;将简历文本输入基于预训练语言模型建立的事件类型识别模型中,识别得到事件类型;将简历文本输入基于预训练语言模型建立的事件元素提取模型中,提取得到事件元素;将属于每个事件类型的事件元素分别输入至对应事件类型的事件分离算法中,得到结构化的事件列表;其中,事件分离算法基于对应事件类型的结构特点规则生成。通过本发明的技术方案,将半结构化和非结构化的简历转化为结构化的形式,有效降低了错误事件元素的识别率,提高了简历事件提取的准确率,方便专业机构人员查看和筛选。