知识组块提取方法、装置、电子设备和存储介质
基本信息
申请号 | CN202110859647.X | 申请日 | - |
公开(公告)号 | CN113298914B | 公开(公告)日 | 2021-10-15 |
申请公布号 | CN113298914B | 申请公布日 | 2021-10-15 |
分类号 | G06T11/60(2006.01)I;G06F40/166(2020.01)I;G06F40/295(2020.01)I;G06N3/04(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 曹梦娣;刘俊辰;陈奇宁 | 申请(专利权)人 | 北京明略软件系统有限公司 |
代理机构 | 北京华夏泰和知识产权代理有限公司 | 代理人 | 蔡良伟;张娜 |
地址 | 100084北京市海淀区中关村东路1号院1号楼10层A1002 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种知识组块提取方法、装置、电子设备和存储介质。其中,方法包括获取PPTX文档中每页幻灯片的文本信息;其中,所述文本信息包括幻灯片中文本框中的文字内容、文本框的位置和文本框中字体大小;根据所述文本信息,确定每页幻灯片的知识类别;基于所述知识类别,对每页幻灯片进行要素抽取,获取每页幻灯片的知识组块。采用本发明提供的方案能利用PPTX文档中的字体格式等信息提取文档中的知识组块,提取更准确。 |
