一种基于多任务模型进行文本处理的方法、装置、计算机装置及计算机可读取存储介质
基本信息
申请号 | CN202110403610.6 | 申请日 | - |
公开(公告)号 | CN113095082A | 公开(公告)日 | 2021-07-09 |
申请公布号 | CN113095082A | 申请公布日 | 2021-07-09 |
分类号 | G06F40/295(2020.01)I;G06F40/284(2020.01)I;G06F40/242(2020.01)I;G06F16/31(2019.01)I;G06F40/30(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 谭洋;段炼;周忠诚;张圣栋;黄九鸣;杜海燕 | 申请(专利权)人 | 湖南四方天箭信息科技有限公司 |
代理机构 | 长沙智嵘专利代理事务所(普通合伙) | 代理人 | 颜汉华 |
地址 | 410000湖南省长沙市高新开发区岳麓西大道588号芯城科技园8栋1301房 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于多任务模型进行文本处理的方法、装置、计算机装置及计算机可读取存储介质,该方法利用一个多任务模型即可同时进行分词处理、词性标注和命名实体识别这三个任务,模型加载快、预测时间短,不存在不同预测模型之间的误差传播,整体精度较高,并且在模型推理过程中通过将分词标签、词性标签和命名实体识别标签融合成一个标签文本,即三个任务使用同一套标签系统,避免了标签系统多而导致可能产生混淆的问题,在模型输出标签文本之后再将融合标签拆分成三个任务对应的标签,然后经过格式化处理后输出,结果更加规范、直观。 |
