基于文本语义的篇章结构分析方法
基本信息

| 申请号 | CN201710307876.4 | 申请日 | - |
| 公开(公告)号 | CN107145479A | 公开(公告)日 | 2017-09-08 |
| 申请公布号 | CN107145479A | 申请公布日 | 2017-09-08 |
| 分类号 | G06F17/22(2006.01)I;G06F17/27(2006.01)I | 分类 | 计算;推算;计数; |
| 发明人 | 张梦迪;郑锦光;段清华;吴珂皓;鲍捷;马新磊 | 申请(专利权)人 | 合肥图谱智能科技有限公司 |
| 代理机构 | 北京万科园知识产权代理有限责任公司 | 代理人 | 北京文因互联科技有限公司;合肥文因互联科技有限公司 |
| 地址 | 100094 北京市海淀区北清路68号院24号楼D座4层695 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明公开了一种基于文本语义的篇章结构分析方法,其步骤如下:步骤1,数据获取;步骤2,正文抽取;步骤3,标题识别和抽取;步骤4,层级结构构建。本发明可以解决纯文本的文档结构信息还原,为文本挖掘任务铺垫基础等技术问题。 |





