基于视觉语义关系的社交媒体流行度预测方法及装置

基本信息

申请号 CN202110895131.0 申请日 -
公开(公告)号 CN113657116A 公开(公告)日 2021-11-16
申请公布号 CN113657116A 申请公布日 2021-11-16
分类号 G06F40/30(2020.01)I;G06F40/284(2020.01)I;G06F40/126(2020.01)I;G06F40/216(2020.01)I;G06K9/00(2006.01)I;G06K9/62(2006.01)I;G06Q10/04(2012.01)I;G06Q50/00(2012.01)I 分类 计算;推算;计数;
发明人 刘安安;杜宏伟;徐宁;宋丹;郭俊波;张勇东 申请(专利权)人 人民网股份有限公司
代理机构 天津市北洋有限责任专利代理事务所 代理人 李林娟
地址 300072天津市南开区卫津路92号
法律状态 -

摘要

摘要 本发明公开了一种基于视觉语义关系的社交媒体流行度预测方法及装置,方法包括:利用预训练的场景图生成器从帖子的图像中提取成对的对象以及它们之间的谓词联系,生成<主语‑谓语‑宾语>关系;使用词向量模型将上述关系编码为语义特征;对帖子的其他数据进行编码,得到文本特征、数值特征和附加用户特征,并与语义特征进行连接;针对测试集部分帖子的用户在训练集中的缺失问题,利用连接的多模态特征分别训练两个Catboost模型,线性结合输出得到初步的流行度分数;利用训练集数据,针对帖子内容对初步的流行度分数进行微调,平衡用户信息带来的模型预测误差,从而得到最终的流行度分数。装置包括:处理器和存储器。本发明提高了流行度预测的准确度。