点击诱饵标题语料识别模型训练方法和装置

基本信息

申请号 CN201810246454.5 申请日 -
公开(公告)号 CN108491389B 公开(公告)日 2021-10-08
申请公布号 CN108491389B 申请公布日 2021-10-08
分类号 G06F40/30(2020.01)I;G06K9/62(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 祁斌川 申请(专利权)人 杭州朗和科技有限公司
代理机构 北京律智知识产权代理有限公司 代理人 阚梓瑄;王卫忠
地址 310052浙江省杭州市滨江区长河街道网商路599号4幢301室
法律状态 -

摘要

摘要 本发明提供了一种点击诱饵标题语料识别模型训练方法和装置。该方法包括:将语料样本集合输入机器学习模型,所述语料样本集合包括已识别为点击诱饵标题语料的语料样本、以及随机语料样本,其中已识别为点击诱饵标题语料的语料样本占语料样本集合中全部语料样本的比例小于预定比例阈值;确定所述机器学习模型识别成点击诱饵标题语料的语料样本的数量占所述语料样本集合中的语料样本数量的占比是否满足预定条件;如果确定的占比满足预定条件,判断停止训练所述机器学习模型。本发明提高了建立点击诱饵标题语料识别模型的效率。