结构化查询语句分类模型训练方法和装置
基本信息
申请号 | CN202110169620.8 | 申请日 | - |
公开(公告)号 | CN112860726A | 公开(公告)日 | 2021-05-28 |
申请公布号 | CN112860726A | 申请公布日 | 2021-05-28 |
分类号 | G06F16/242(2019.01)I;G06F16/28(2019.01)I;G06F16/2458(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 雷涛;乔旺龙;吕慧 | 申请(专利权)人 | 天云融创数据科技(北京)有限公司 |
代理机构 | 北京开阳星知识产权代理有限公司 | 代理人 | 张通 |
地址 | 100025北京市朝阳区东四环中路78号大成国际中心A1座9A08-9A09 | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种结构化查询语句分类模型训练方法和装置,包括:对所有训练用样本查询语句中的关键字进行特征选择,确定第一预设数量的选定关键字;根据所述训练用样本查询语句中包含的所述选定关键字,按照设定的选定关键字排序,构建表征所述训练用样本查询语句特征的特征向量;采用各个所述训练用样本查询语句对应的特征向量和分类标签,对所述结构化查询语句分类模型进行训练。因为采用的选定关键字是对关键字再做特征处理后得到,排除了常用关键字在模型训练过程中引入的影响,使得模型被训练为更关注核心关键字特征,也就使得模型使用过程中的预测精度更高。 |
