基于滑动窗口技术的细粒度主题提取方法

基本信息

申请号 CN201810485599.0 申请日 -
公开(公告)号 CN108763390A 公开(公告)日 2018-11-06
申请公布号 CN108763390A 申请公布日 2018-11-06
分类号 G06F17/30;G06Q30/06 分类 计算;推算;计数;
发明人 徐文庆;孟鹏;陈晓峰;肖果;黄泰文;金正明 申请(专利权)人 浙江新能量科技股份有限公司
代理机构 杭州杭诚专利事务所有限公司 代理人 王江成;韩斐
地址 310011 浙江省杭州市拱墅区湖墅南路332号新能量大楼
法律状态 -

摘要

摘要 本发明涉及基于滑动窗口技术的细粒度主题提取方法,解决了现有技术的不足,技术方案为:步骤S1,把评论作为滑动窗口的集合;步骤S2,计算采样词的主题归属于全局主题或是局部主题以及所属窗口的条件概率分布;步骤S3,构建关于滑动窗口、全部主题或局部主题的联合概率分布函数;步骤S4,分别计算词wd,n选择的概率,滑动窗口v选择的概率,全局主题z的选择概率,以及局部主题z选择的概率;步骤S5,根据步骤S4的计算结果将大于设定值的全局主题和局部主题提取并显示。