一种实体识别训练数据BIO自动标注系统及方法

基本信息

申请号 202011208221X 申请日 -
公开(公告)号 CN112270180A 公开(公告)日 2021-01-26
申请公布号 CN112270180A 申请公布日 2021-01-26
分类号 G06F40/279(2020.01)I; 分类 计算;推算;计数;
发明人 肖波 申请(专利权)人 北京阳光云视科技有限公司
代理机构 - 代理人 -
地址 100089北京市海淀区上地信息路7号5层508
法律状态 -

摘要

摘要 本发明公开了一种实体识别训练数据BIO自动标注系统及方法,实体识别训练数据BIO自动标注系统,包括格式化处理模块、信息分析模块及BIO格式转换模块,所述格式化处理模块用于原始素材的格式化处理;所述信息分析模块使用多种算法进行信息标注,生成带有实体分析信息的内容文件;所述BIO格式转换模块将带有实体名称分析信息的文件生成BIO标注信息的格式文件。本发明解决了标注信息的工作量问题,大大节约了成本和缩短了时间。