基于流式数据的自动化层级探索方法和装置

基本信息

申请号 CN202110377785.4 申请日 -
公开(公告)号 CN113111085A 公开(公告)日 2021-07-13
申请公布号 CN113111085A 申请公布日 2021-07-13
分类号 G06F16/2455(2019.01)I;G06F16/23(2019.01)I;G06F16/9535(2019.01)I;G06F16/2457(2019.01)I 分类 计算;推算;计数;
发明人 郝俊禹;陈运文;文辉;于敬;纪达麒;王文广 申请(专利权)人 达观数据有限公司
代理机构 上海智力专利商标事务所(普通合伙) 代理人 周涛
地址 201203上海市浦东新区亮秀路112号B座301、303、304室
法律状态 -

摘要

摘要 本发明涉及数据探索方法领域,具体涉及基于流式数据的自动化层级探索方法和装置,该方法基于流式计算框架,包括:创建物品候选集、从物品候选集中获取样本生成新物品候选集、将新物品候选集中的样本推送给终端用户、通过流式计算框架采集终端用户行为数据、通过用户行为数据触发新物品候选集更新;新物品候选集包括若干不同层级,较高层级新物品候选集的样本来自前一较低层级新物品候选集。本发明通过对线上实时流式数据进行处理,监控新物品候选集的曝光次数来自动触发候选集的更新,解决定时更新导致的曝光不均的问题;设置若干不同层级的新物品候选集,解决了新物品不同曝光次数下置信度相同的问题。