一种基于索引数据的自然语言处理方法和系统
基本信息
申请号 | CN202111133911.8 | 申请日 | - |
公开(公告)号 | CN113988078A | 公开(公告)日 | 2022-01-28 |
申请公布号 | CN113988078A | 申请公布日 | 2022-01-28 |
分类号 | G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 刘善辉;刘宝霞;孙琪;李文成;刘旭;李修娴 | 申请(专利权)人 | 北京语言大学 |
代理机构 | 北京国坤专利代理事务所(普通合伙) | 代理人 | 张国栋 |
地址 | 100083北京市海淀区学院路15号 | ||
法律状态 | - |
摘要
摘要 | 本发明属于自然语言识别技术领域,公开了一种基于索引数据的自然语言处理方法和系统,所述基于索引数据的自然语言处理系统包括:索引形成模块、索引连接模块、语料向量形成模块、中央控制模块、训练集构建模块、模型训练模块、输入模块、特征提取模块、特征连接模块、存储显示模块。本发明针对汉语的潜在语义内涵利用语言形成的象形结构的映射逻辑建立基本维度向量,利用汉语语句的语境多样性训练循环神经网络获得词语在复杂维度隐含语义特征及语义相关性特征中适当向量表达的确定循环神经网络的结构参数;利用形成的汉语语句模型有效处理汉语每一字词形成对应隐性上下文维度的向量表达,有利于形成与实际语义处理任务相适应的向量维度空间。 |
