基于深度学习的数值词处理方法、系统、终端及介质

基本信息

申请号 CN202010680740.X 申请日 -
公开(公告)号 CN113961664A 公开(公告)日 2022-01-21
申请公布号 CN113961664A 申请公布日 2022-01-21
分类号 G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/289(2020.01)I;G06K9/62(2022.01)I 分类 计算;推算;计数;
发明人 沈李斌;屠可伟;蒋承越;奚宁;李波 申请(专利权)人 上海乐言科技股份有限公司
代理机构 北京酷爱智慧知识产权代理有限公司 代理人 邹成娇
地址 200051上海市长宁区天山支路201号二层2032室
法律状态 -

摘要

摘要 本发明公开了基于深度学习的数值词处理系统,包括:原型词确定模块从语料中找到具有代表性的原型词集合;训练模块包括判断单元、差值单元和数值词训练单元;判断单元判断原型词集合中的词是否为数值词;差值单元用于从原型词集合中采用差值方法来表示任意数值词的词向量;所述数值词训练单元将该数值词利用原型词集合以及插值函数进行插值,得到数值词表示;将得到的数值词表示输入SkipGram训练模块进行训练,训练得到原型数值词词向量。通过在语料中找到具有代表性的原型词集合,利用差值方法从有限的原型词表示任意的数值词,将数值词输入SkipGram训练模块训练,输出高质量的原型数值词词向量。