一种基于深度学习的简历解析方法和系统

基本信息

申请号 CN202010728915.X 申请日 -
公开(公告)号 CN111737969B 公开(公告)日 2020-10-02
申请公布号 CN111737969B 申请公布日 2020-10-02
分类号 G06F40/205(2020.01)I 分类 计算;推算;计数;
发明人 安永进;鲁林;唐晓阳;闫慧强 申请(专利权)人 北森云计算有限公司
代理机构 成都九鼎天元知识产权代理有限公司 代理人 北森云计算有限公司
地址 610041四川省成都市高新区萃华路89号1栋1单元4001号
法律状态 -

摘要

摘要 本发明涉及电数字数据处理技术领域,本发明公开了一种基于深度学习的简历解析方法和系统,该简历解析方法包括富文本提取、文本清洗、文本排序、语句切分、语句分类、区块识别、条目划分和区块内字段值提取步骤,并在此过程中结合NLP、OCR和命名实体识别等技术对简历特征进行建模和规模化的模型训练。本发明从文本提取阶段,就把样式、位置等信息作为和文本同等重要的信息一并提取返回,并在后续分句、区块和条目识别、类别映射等阶段融入样式信息,达到让解析器像人一样重点突出地阅读简历的目的,从而提升整体解析效果。