一种主题分层建模中主题词/序列的提取方法

基本信息

申请号 CN202210329550.2 申请日 -
公开(公告)号 CN114757197A 公开(公告)日 2022-07-15
申请公布号 CN114757197A 申请公布日 2022-07-15
分类号 G06F40/30(2020.01)I;G06F40/216(2020.01)I;G06K9/62(2022.01)I 分类 计算;推算;计数;
发明人 冯晓燕;吴晨 申请(专利权)人 同方知网数字出版技术股份有限公司
代理机构 北京天奇智新知识产权代理有限公司 代理人 -
地址 100192北京市海淀区西小口路66号东升科技园B2楼
法律状态 -

摘要

摘要 本发明公开了一种主题分层建模中主题词/序列的提取方法,包括:获取主题分层建模的模型输出;根据模型输出提取主题词/序列;展示主题的词/序列特征表示结果。本发明可以在挖掘层次化主题结构的过程中更好的表示主题,既体现了上下层级主题间的相关性,也凸显出了上下层级主题间的差异性和同层主题间的差异性,使主题不仅在结构上呈现出层次性,在表示上也体现了层次化。