一种基于SegaBert预训练模型的文本、简历和理财公告抽取方法专利查询专利号|摘要-满商公司网

一种基于SegaBert预训练模型的文本、简历和理财公告抽取方法

基本信息

摘要

摘要	本发明公开了一种基于SegaBert预训练模型的文本、简历和理财公告抽取方法在预训练阶段，能利用更丰富的位置表征，对段落、句子、词语三者间的位置关系联合建模，对输入的文本能做到片段感知，提升了预训练语言模型的文本编码能力，使其在微调阶段得到更完善的句子和篇章表示，进而提升下游任务的预测效果。增加对标注和训练样本预处理，能够筛选出更合理的数据；提取简历文本信息，对各个简历文本信息进行中文分词，实现所需简历信息的准确提取，可以提高简历信息的抽取效率；通过对理财公告的文本进行标注，通过对预训练模型进行预训练，从而通过训练后的预训练模型实现理财公告信息的获取。