一种基于语料领域的语料处理系统

基本信息

申请号 CN201910009322.5 申请日 -
公开(公告)号 CN109871533B 公开(公告)日 2019-12-10
申请公布号 CN109871533B 申请公布日 2019-12-10
分类号 G06F17/27(2006.01); G06K9/62(2006.01); G06N3/04(2006.01); G06N3/08(2006.01) 分类 计算;推算;计数;
发明人 孔洋洋; 陈飞宇; 朱劲松 申请(专利权)人 北京车慧科技有限公司
代理机构 北京市维诗律师事务所 代理人 李翔;杨安进
地址 100044 北京市海淀区西直门外大街168号腾达大厦21层2101-2103、2105-2111
法律状态 -

摘要

摘要 本申请公开了一种基于语料领域的语料处理系统。该系统包括:第一训练模块,用于根据开放领域语料训练第一编码模型,根据目标领域参考语料训练第二编码模型;向量模块,用于将目标领域语料输入所述第一编码模型得到第一向量,将目标领域语料输入所述第二编码模型得到第二向量,将目标领域语料输入第三模型得到第三向量;第二训练模块,用于根据所述第一向量、所述第二向量以及所述第三向量训练语料处理模型。本申请的提供的技术方案,由于利用了开放领域的先验知识,减少了标签数据使用量,使得不仅效果得到显著提升,而且训练时间也大大缩短。