面向智能节目制作的训练数据生成方法及装置

基本信息

申请号 CN201811251494.5 申请日 -
公开(公告)号 CN111105817A 公开(公告)日 2021-08-17
申请公布号 CN111105817A 申请公布日 2021-08-17
分类号 G11B27/031;G11B27/34 分类 信息存储;
发明人 薛子育;郭沛宇;王磊 申请(专利权)人 国家新闻出版广电总局广播科学研究院
代理机构 北京博雅睿泉专利代理事务所(特殊普通合伙) 代理人 闫雪薇;马佑平
地址 100866 北京市西城区复兴门外大街2号
法律状态 -

摘要

摘要 本发明公开了一种面向智能节目制作的训练数据集生成方法及装置。该方法包括:根据节目内容,获取节目内容片段;根据节目编目信息,获取节目语义片段;从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息;按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集;输出所述训练数据集。根据本发明实施例,可以快速生成用于智能化节目制作模型的训练数据集,节省了大量的人工成本和时间,提高了训练数据集的生成效率。