一种主题分层建模中主题词/序列的提取方法
基本信息
申请号 | CN202210329550.2 | 申请日 | - |
公开(公告)号 | CN114757197A | 公开(公告)日 | 2022-07-15 |
申请公布号 | CN114757197A | 申请公布日 | 2022-07-15 |
分类号 | G06F40/30(2020.01)I;G06F40/216(2020.01)I;G06K9/62(2022.01)I | 分类 | 计算;推算;计数; |
发明人 | 冯晓燕;吴晨 | 申请(专利权)人 | 同方知网数字出版技术股份有限公司 |
代理机构 | 北京天奇智新知识产权代理有限公司 | 代理人 | - |
地址 | 100192北京市海淀区西小口路66号东升科技园B2楼 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种主题分层建模中主题词/序列的提取方法,包括:获取主题分层建模的模型输出;根据模型输出提取主题词/序列;展示主题的词/序列特征表示结果。本发明可以在挖掘层次化主题结构的过程中更好的表示主题,既体现了上下层级主题间的相关性,也凸显出了上下层级主题间的差异性和同层主题间的差异性,使主题不仅在结构上呈现出层次性,在表示上也体现了层次化。 |
