一种基于数据库的文档搜索方法和装置

基本信息

申请号 CN202010292856.6 申请日 -
公开(公告)号 CN111522905A 公开(公告)日 2020-08-11
申请公布号 CN111522905A 申请公布日 2020-08-11
分类号 G06F16/31(2019.01)I 分类 -
发明人 吴祥;樊国鹏;朱留锋 申请(专利权)人 武汉灯塔之光科技有限公司
代理机构 深圳市六加知识产权代理有限公司 代理人 武汉灯塔之光科技有限公司
地址 430000湖北省武汉市东湖新技术开发区光谷大道41号现代·国际设计城一期2栋15层08室
法律状态 -

摘要

摘要 本发明涉及数据搜索领域,特别是涉及一种基于数据库的文档搜索方法和装置。其主要步骤为:对数据库中待搜索的文档进行采集;对采集到的每个待搜索的文档进行分词,并对每个待搜索的文档建立搜索关键词与文档之间的倒排索引;根据至少一个搜索关键词,通过倒排索引对包含搜索关键词的待搜索的文档进行查找;获取每个文档和搜索关键词的关联度,根据关联度对查找到的包含有搜索关键词的文档进行排序;将查找到的文档根据排序后的顺序进行发布。本发明可以提高搜索速度,并为不同的用户需求和不同的应用场景提供适合的搜索结果的呈现顺序。