知识组块提取方法、装置、电子设备和存储介质
基本信息

| 申请号 | CN202110859647.X | 申请日 | - |
| 公开(公告)号 | CN113298914B | 公开(公告)日 | 2021-10-15 |
| 申请公布号 | CN113298914B | 申请公布日 | 2021-10-15 |
| 分类号 | G06T11/60(2006.01)I;G06F40/166(2020.01)I;G06F40/295(2020.01)I;G06N3/04(2006.01)I | 分类 | 计算;推算;计数; |
| 发明人 | 曹梦娣;刘俊辰;陈奇宁 | 申请(专利权)人 | 北京明略软件系统有限公司 |
| 代理机构 | 北京华夏泰和知识产权代理有限公司 | 代理人 | 蔡良伟;张娜 |
| 地址 | 100084北京市海淀区中关村东路1号院1号楼10层A1002 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明公开了一种知识组块提取方法、装置、电子设备和存储介质。其中,方法包括获取PPTX文档中每页幻灯片的文本信息;其中,所述文本信息包括幻灯片中文本框中的文字内容、文本框的位置和文本框中字体大小;根据所述文本信息,确定每页幻灯片的知识类别;基于所述知识类别,对每页幻灯片进行要素抽取,获取每页幻灯片的知识组块。采用本发明提供的方案能利用PPTX文档中的字体格式等信息提取文档中的知识组块,提取更准确。 |





