一种基于命名实体识别提取短信文本摘要的方法及装置

基本信息

申请号 CN202010435221.7 申请日 -
公开(公告)号 CN111597813A 公开(公告)日 2020-08-28
申请公布号 CN111597813A 申请公布日 2020-08-28
分类号 G06F40/295(2020.01)I;G06F16/34(2019.01)I 分类 计算;推算;计数;
发明人 元方;唐小波;宋争光;郭乐;郭盛楠 申请(专利权)人 上海创蓝云智信息科技股份有限公司
代理机构 成都智言知识产权代理有限公司 代理人 胡文莉
地址 201600上海市松江区中创路68号19幢
法律状态 -

摘要

摘要 本发明涉及文本信息识别技术领域,尤其是一种基于命名实体识别提取短信文本摘要的方法及装置,包括下述步骤:S1.准备待提取摘要的短信文本集合;S2.标注短信文本集合,每条短信文本需要标注两部分,组织实体词与产品实体词;S3.收集短信文本的标注数据进行AI模型训练;S4.当S3的AI模型训练完成后对数据进行预测并识别;S5.将AI模型预测出的组织实体词与产品实体词作为短信文本的摘要。本发明能自动提取短信摘要;标注数据简单,只用标记两组词即可;训练后的AI模型提取的短信文本摘要准确性高且内容简洁,极大提高了短信文本审核的准确率和效率。