基于NLP的调研数据标准化方法及系统
基本信息
申请号 | CN202110680101.8 | 申请日 | - |
公开(公告)号 | CN113326310A | 公开(公告)日 | 2021-08-31 |
申请公布号 | CN113326310A | 申请公布日 | 2021-08-31 |
分类号 | G06F16/25(2019.01)I;G06Q30/02(2012.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 周羽;张吴;黄海波;邓莎 | 申请(专利权)人 | 立信(重庆)数据科技股份有限公司 |
代理机构 | 重庆强大凯创专利代理事务所(普通合伙) | 代理人 | 冉剑侠 |
地址 | 401120重庆市渝北区仙桃数据谷东路19号 | ||
法律状态 | - |
摘要
摘要 | 本发明属于数据处理领域,具体涉及基于NLP的调研数据标准化方法及系统,该方法包括:标准库制作步骤,创建标准库,制定各研究领域的标准描述并存储在标准库中,标准描述包括研究领域标准描述、指标标准描述及指标选项标准描述;数据录入步骤,录入项目的调研数据及描述信息,描述信息包括领域描述、指标描述及指标选项描述;信息识别步骤,对录入的描述信息分别进行分词后再进行向量化得到词向量,再利用LSTM对词向量与标准库进行识别,根据计算出的相似度中选择预设数量的相似度最高的标准描述;关联确认步骤,从识别出的标准描述中选择出最准确的一个,并将其与对应的描述信息进行关联。本申请能够在保证处理效率的同时保证处理的准确率。 |
