标签识别模型的训练、文本标签识别的方法及装置

基本信息

申请号 CN202111086685.2 申请日 -
公开(公告)号 CN113934867A 公开(公告)日 2022-01-14
申请公布号 CN113934867A 申请公布日 2022-01-14
分类号 G06F16/383(2019.01)I;G06K9/62(2022.01)I 分类 计算;推算;计数;
发明人 陈莹莹;黄于晏 申请(专利权)人 有米科技股份有限公司
代理机构 广州三环专利商标代理有限公司 代理人 肖宇扬;江银会
地址 510006广东省广州市番禺区小谷围街青蓝街26号1701
法律状态 -

摘要

摘要 本发明公开了一种标签识别模型的训练、文本标签识别的方法及装置,该方法通过特征提取模型提取的样本文本的文本特征对基础标签识别模型执行训练操作,能够训练出精准的标签识别模型,从而有利于使用该精准的标签识别模型识别文本的标签,提高文本的标签的识别准确性及效率;以及通过先基于轻量级特征提取模型(如ALBERT模型)提取样本文本的文本特征,弥补了单纯使用基础标签识别模型开始对样本文本处理时无法捕捉到样本文本的上下文语义信息的缺点及有利于训练到模型较小的标签识别模型,从而使标签识别模型更易应用到实际中去,提高了标签识别模型的适用性,如:适用于多字符(如词语)的长文本。