一种语句向量的计算方法及装置

基本信息

申请号 CN201811620274.5 申请日 -
公开(公告)号 CN109684458A 公开(公告)日 2019-04-26
申请公布号 CN109684458A 申请公布日 2019-04-26
分类号 G06F16/332(2019.01)I; G06F17/27(2006.01)I 分类 计算;推算;计数;
发明人 雷少东; 刘世明 申请(专利权)人 北京壹捌零数字技术有限公司
代理机构 北京华仲龙腾专利代理事务所(普通合伙) 代理人 北京壹捌零数字技术有限公司
地址 100102 北京市朝阳区阜通东大街1号院6号楼5层3单元230609
法律状态 -

摘要

摘要 本申请提供了一种语句向量的计算方法及装置,其中,所述方法包括:采集文本中的单条语句;根据预设语义分析规则,确定所述单条语句的语义信息,所述语义信息至少包括:主题、主题权重、各主题所包含的关键词以及各关键词在对应主题内的关键词权重;根据所述语义信息,计算各所述关键词在集合全部所述主题所对应的关键词中的参考权重;根据所述参考权重和预设筛选阈值,确定目标关键词;根据所述目标关键词及各所述目标关键词所对应的参考权重,计算语句向量。本申请提供的语句向量的计算方法及装置,能够有效提升文本间相似度的计算质量,令语义相似的语句距离较近,反之,语义不相似的语句距离较远。