一种基于语料领域的语料处理系统
基本信息
申请号 | CN201910009322.5 | 申请日 | - |
公开(公告)号 | CN109871533B | 公开(公告)日 | 2019-12-10 |
申请公布号 | CN109871533B | 申请公布日 | 2019-12-10 |
分类号 | G06F17/27(2006.01); G06K9/62(2006.01); G06N3/04(2006.01); G06N3/08(2006.01) | 分类 | 计算;推算;计数; |
发明人 | 孔洋洋; 陈飞宇; 朱劲松 | 申请(专利权)人 | 北京车慧科技有限公司 |
代理机构 | 北京市维诗律师事务所 | 代理人 | 李翔;杨安进 |
地址 | 100044 北京市海淀区西直门外大街168号腾达大厦21层2101-2103、2105-2111 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种基于语料领域的语料处理系统。该系统包括:第一训练模块,用于根据开放领域语料训练第一编码模型,根据目标领域参考语料训练第二编码模型;向量模块,用于将目标领域语料输入所述第一编码模型得到第一向量,将目标领域语料输入所述第二编码模型得到第二向量,将目标领域语料输入第三模型得到第三向量;第二训练模块,用于根据所述第一向量、所述第二向量以及所述第三向量训练语料处理模型。本申请的提供的技术方案,由于利用了开放领域的先验知识,减少了标签数据使用量,使得不仅效果得到显著提升,而且训练时间也大大缩短。 |
