一种基于WMD的中文问答匹配方法

基本信息

申请号 CN201710539034.1 申请日 -
公开(公告)号 CN107391614A 公开(公告)日 2017-11-24
申请公布号 CN107391614A 申请公布日 2017-11-24
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 杜云贵;杜若;李智星;侯聪;晏世凯;刘科 申请(专利权)人 重庆智慧思特大数据有限公司
代理机构 重庆市恒信知识产权代理有限公司 代理人 重庆智慧思特大数据有限公司;重庆明斯基数据科技有限公司
地址 400065 重庆市南岸区广福大道12号3号楼22楼
法律状态 -

摘要

摘要 本发明请求保护一种基于WMD的中文问答匹配方法,涉及自然语言处理领域。包括步骤:目标领域的知识库的建立步骤:对知识库的数据预处理步骤:常用同义词词典的建立步骤:词语距离字典的建立步骤:用户提问信息的预处理步骤:文档向量化表示步骤:问句检索及问句匹配步骤:答案返回。采用改进的WMD距离算法度量问句之间的相似性。区别于搜索引擎,本发明允许用户以自然语言的方式查询,并直接返回工整的答案。值得一提的是,本发明在问句匹配过程中兼顾了问句的外在表现形式和问句的内在语义信息,使得本发明能够应对用户提出的类型更为复杂的问句。