基于倒排索引的短文本匹配方法及装置

基本信息

申请号 CN202010328205.8 申请日 -
公开(公告)号 CN111581329A 公开(公告)日 2020-08-25
申请公布号 CN111581329A 申请公布日 2020-08-25
分类号 G06F16/31(2019.01)I 分类 -
发明人 陈恒生;叶浩 申请(专利权)人 上海兑观信息科技技术有限公司
代理机构 上海互顺专利代理事务所(普通合伙) 代理人 上海兑观信息科技技术有限公司
地址 201203上海市浦东新区中国(上海)自由贸易试验区郭守敬路498号6幢2层15202、15201、15203室
法律状态 -

摘要

摘要 本发明适用于自然语言处理技术领域,提供了基于倒排索引的短文本匹配方法及装置,该方法包括:对输入的文字进行特征提取,并把提取后的特征与知识库中的规则模板进行一一匹配,查找到最合适的模板。特别地,本发明在特征提取之后,采用倒排索引技术对输入的文字建立倒排索引,优化了匹配时的计算效率,从而大大加快之后与知识库中的模板进行一一匹配的过程。该装置包括规则模板知识库、特征提取器、特征扩展器、倒排索引生成器、模板编译器和模板匹配器。本发明可应用于智能客服、问答系统中的问题匹配,或者其他信息检索场景下的用户输入匹配,还可以进行灵活而复杂的文本匹配规则设置,同时保证匹配过程的高效率执行。