一种基于多任务模型进行文本处理的方法、装置、计算机装置及计算机可读取存储介质

基本信息

申请号 CN202110403610.6 申请日 -
公开(公告)号 CN113095082A 公开(公告)日 2021-07-09
申请公布号 CN113095082A 申请公布日 2021-07-09
分类号 G06F40/295(2020.01)I;G06F40/284(2020.01)I;G06F40/242(2020.01)I;G06F16/31(2019.01)I;G06F40/30(2020.01)I 分类 计算;推算;计数;
发明人 谭洋;段炼;周忠诚;张圣栋;黄九鸣;杜海燕 申请(专利权)人 湖南四方天箭信息科技有限公司
代理机构 长沙智嵘专利代理事务所(普通合伙) 代理人 颜汉华
地址 410000湖南省长沙市高新开发区岳麓西大道588号芯城科技园8栋1301房
法律状态 -

摘要

摘要 本发明公开了一种基于多任务模型进行文本处理的方法、装置、计算机装置及计算机可读取存储介质,该方法利用一个多任务模型即可同时进行分词处理、词性标注和命名实体识别这三个任务,模型加载快、预测时间短,不存在不同预测模型之间的误差传播,整体精度较高,并且在模型推理过程中通过将分词标签、词性标签和命名实体识别标签融合成一个标签文本,即三个任务使用同一套标签系统,避免了标签系统多而导致可能产生混淆的问题,在模型输出标签文本之后再将融合标签拆分成三个任务对应的标签,然后经过格式化处理后输出,结果更加规范、直观。