一种基于语义分析与关键词识别的检索方法和装置
基本信息
申请号 | CN202011442031.4 | 申请日 | - |
公开(公告)号 | CN112507109A | 公开(公告)日 | 2021-03-16 |
申请公布号 | CN112507109A | 申请公布日 | 2021-03-16 |
分类号 | G06F40/284(2020.01)I;G06F40/205(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06F16/335(2019.01)I;G06F16/338(2019.01)I;G06F40/30(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 刘伟;刘灿;吴永杰;钟延珍;陈善雄;李莉;李磊;王雪春;王仲煜 | 申请(专利权)人 | 重庆知识产权大数据研究院有限公司 |
代理机构 | 重庆智慧之源知识产权代理事务所(普通合伙) | 代理人 | 高彬 |
地址 | 400023重庆市江北区五江路18号1-1号、附1号1-8室6号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种基于语义分析与关键词识别的检索方法和装置,包括以下步骤:通过Textrank算法对专利文本提取专利关键词,获取专利关键词数据集,并根据Elmo动态词向量转换算法进行向量转换,获取专利关键词向量集;通过层次分析法对专利文本的标题、摘要、首项权利要求和技术功效句确定权重,并根据待检索关键词从高权重到低权重对指标信息中的关键词进行匹配,获取匹配关键词向量集,并将匹配关键词向量集输入权重模型,计算对应专利文本的权重值,根据权重值进行TOP‑K排序,形成检索结果并呈现至用户端。本发明能够扩大相关专利的覆盖面,对专利文本中的内容进行语义分析和关键词识别,从而提高检索结果的相关性。 |
