一种基于多路召回的垂直领域实体链指系统

基本信息

申请号 CN202011431197.6 申请日 -
公开(公告)号 CN112231449A 公开(公告)日 2021-01-15
申请公布号 CN112231449A 申请公布日 2021-01-15
分类号 G06F16/33(2019.01)I 分类 计算;推算;计数;
发明人 刘广峰;鲁思帆 申请(专利权)人 杭州识度科技有限公司
代理机构 杭州华知专利事务所(普通合伙) 代理人 杭州识度科技有限公司
地址 310000浙江省杭州市余杭区五常街道创智天地中心11幢501-506室
法律状态 -

摘要

摘要 本发明涉及一种基于多路召回的垂直领域实体链指系统,包括:文本处理模块:用于对用户得到输入文本进行分词、筛选,并拼接为有效文本;相似度匹配模块:用于对有效文本与实体之间的相似度进行计算,并根据相似度对实体进行排序、筛选;词典匹配模块:用于检索用户输入有效文本,获得候选实体;实体识别模块:利用识别模型对有效文本对应进行命名实体识别,并生成候选实体;文本二分类模型:构建二分类模型,基于二分类模型进行实体是否匹配的文本的判断,制定规则进行后校验操作;本发明能够充分利用用户输入文本的字词信息,解决由于中文咨询文本命名实体识别标注语料口语化严重导致实体链指低准确率,低召回率的问题。