一种文章关键句自动标注方法及装置

基本信息

申请号 CN201910036353.X 申请日 -
公开(公告)号 CN111435405A 公开(公告)日 2020-07-21
申请公布号 CN111435405A 申请公布日 2020-07-21
分类号 G06F40/117(2020.01)I 分类 -
发明人 张灵箫;李萌;孙雪飞;王雨晗 申请(专利权)人 北京行数通科技有限公司
代理机构 - 代理人 -
地址 100081北京市海淀区丹棱街18号创富大厦9层902
法律状态 -

摘要

摘要 本发明提供了一种文章关键句自动标注方法及装置,主要包括:对文章进行段落分析,拆分成多个段落;将拆分后的每一段按照标点符号进一步拆分为句子;选定最能代表文章中心的内容,作为核心内容;将拆分的所述多个段落按照和核心内容内容的语义匹配程度进行排序;从排序靠前的段落开始,将段落中的各个句子依次按照和核心内容的内容语义匹配程度排序;依次在每一段中选取匹配程度达到第一阈值,且长度合适的句子作为关键句;当关键句的数量达到第二阈值时,对得到的关键句进行自动标注。本发明提出的文章关键句自动标注方法,自动为一篇文章“划重点”,也就是标记关键内容,帮助用户阅读文章时迅速浏览,快速识别、消化文章的重点内容,加快信息消费的速度,提高阅读类软件的用户体验。