文本摘要的抽取方法、装置、可读存储介质及电子设备
基本信息
申请号 | CN202011112242.1 | 申请日 | - |
公开(公告)号 | CN112347240A | 公开(公告)日 | 2021-02-09 |
申请公布号 | CN112347240A | 申请公布日 | 2021-02-09 |
分类号 | G06F16/34(2019.01)I; | 分类 | 计算;推算;计数; |
发明人 | 姜涛;王会珍;张新新 | 申请(专利权)人 | 小牛思拓(北京)科技有限公司 |
代理机构 | 北京超凡宏宇专利代理事务所(特殊普通合伙) | 代理人 | 毕翔宇 |
地址 | 100000北京市北京经济技术开发区科创十三街18号院6号楼1层104 | ||
法律状态 | - |
摘要
摘要 | 本申请提供了文本摘要的抽取方法、装置、可读存储介质及电子设备,将待抽取文本分割成多个语句;针对于每一个语句,比较该语句与其他语句之间的多个相似度,确定该语句的第一系数;将该语句输入至实体识别模型中,确定该语句的第二系数;基于第一系数、第二系数以及该语句的位置,确定该语句的综合系数;将综合系数排序位于预设位置之前的至少一个目标语句,组合成待抽取文本的摘要。这样,通过计算语句相似度、语句中实体数量以及语句在文本中的位置,确定出每个语句的综合系数,进而依据每个语句的综合系数的排序,确定出文本的摘要,可以提高语句抽取的全面性以及准确率,有助于提高摘要的抽取质量以及可读性。 |
