一种基于双数组Trie的文本标注方法、终端设备及存储介质
基本信息
申请号 | CN202011356101.4 | 申请日 | - |
公开(公告)号 | CN112364605A | 公开(公告)日 | 2021-02-12 |
申请公布号 | CN112364605A | 申请公布日 | 2021-02-12 |
分类号 | G06F40/157(2020.01)I; | 分类 | 计算;推算;计数; |
发明人 | 黄进振;丘斌;刘志军 | 申请(专利权)人 | 智业软件股份有限公司 |
代理机构 | 厦门市精诚新创知识产权代理有限公司 | 代理人 | 何家富 |
地址 | 361000福建省厦门市思明区观日路24号 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种基于双数组Trie的文本标注方法、终端设备及存储介质,该方法中包括:S1:构建字典库,并将字典库装载至双数组Trie中;S2:将待标注文本拆分成多个句子后,通过装载后的双数组Trie对每个句子中的待标注的词进行识别,并根据识别到的词的属性生成标注格式数据,通过标注格式数据对待标注文本进行自动标注;S3:将自动标注的结果发送用户界面进行人工审核,当接收到修改指令后,根据修改指令对中自动标注的结果进行修改,并根据修改结果对字典库的内容进行更新,返回S1;否则,结束。本发明通过将字典库装载在双数组Trie结构中进行自动标注,大大提升了自动标注的效率。 |
