内容聚类方法及系统

基本信息

申请号 CN202111070507.0 申请日 -
公开(公告)号 CN113515648A 公开(公告)日 2021-10-19
申请公布号 CN113515648A 申请公布日 2021-10-19
分类号 G06F16/45(2019.01)I 分类 计算;推算;计数;
发明人 王宇琪;张佳旭;郭建彬;蒋永余;方省;曹家;罗引;王磊 申请(专利权)人 北京中科闻歌科技股份有限公司
代理机构 北京开阳星知识产权代理有限公司 代理人 袁义科
地址 100028北京市海淀区北四环西路9号楼银谷大厦7层0715室
法律状态 -

摘要

摘要 本公开涉及一种内容聚类方法及系统。该方法包括:获取待聚类的多媒体内容集,待聚类的多媒体内容集包括第一多媒体内容集和第二多媒体内容集,根据第一多媒体内容集中第一多媒体内容的多媒体特征生成第一聚类簇,多媒体特征包括语义特征、实体特征以及词语特征中的至少两种,以第一聚类簇中的簇中心为聚类中心,对第二多媒体内容集中第二多媒体内容进行聚类,得到目标聚类簇。通过上述技术方案,实现了准确且快速的对多媒体内容进行聚类,以满足自然语言处理场景的实际聚类需求。