一种基于双向Transformer模型的层级标签抽取方法
基本信息
申请号 | CN202111021402.6 | 申请日 | - |
公开(公告)号 | CN113705704A | 公开(公告)日 | 2021-11-26 |
申请公布号 | CN113705704A | 申请公布日 | 2021-11-26 |
分类号 | G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 金勇;陈宏明;胡林利 | 申请(专利权)人 | 武汉长江通信产业集团股份有限公司 |
代理机构 | 上海精晟知识产权代理有限公司 | 代理人 | 刘点 |
地址 | 430000湖北省武汉市东湖开发区关东工业园文华路2号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于双向Transformer模型的层级标签抽取方法,包括如下步骤:通过无监督预训练文本数据得到特征向量;利用双向Transformer模型对特征向量进一步调优;结合多层标签知识库体系,利用softmax和人工标注标签对嵌套Multi‑Class分类模型进行监督式训练;最后输出层级预测标签。本发明采用双向Transformer模型,结合多级标签嵌套到multi‑class分类模型中学习训练。本发明方法实现了对于文本多级分类标签的学习,可用于网络舆情文本的自动标签(某领域的若干特定标签),以及警务平台中的案情分析(案件手法的层层深入),从而实现对于文本数据的立体标签化。 |
