句子级用户画像生成方法、装置及存储介质

基本信息

申请号 CN202110171840.4 申请日 -
公开(公告)号 CN112989038B 公开(公告)日 2022-06-21
申请公布号 CN112989038B 申请公布日 2022-06-21
分类号 G06F16/35;G06F16/33;G06F40/289;G06F17/16 分类 计算;推算;计数;
发明人 徐涛 申请(专利权)人 浙江连信科技有限公司
代理机构 北京知果之信知识产权代理有限公司 代理人 卜荣丽;李志刚
地址 310000 浙江省杭州市拱墅区新华路266号三楼3505室
法律状态 -

摘要

摘要 本发明提供一种句子级用户画像生成方法、装置及存储介质,包括:接收会话语料,基于爬虫系统对所述会话语料进行处理获取目标语料,其中目标语料包括一个或多个文本;对文本进行分词处理,获得每个文本分词的词向量,基于每个文本分词的词向量生成该文本的句向量;将句向量转换为矩阵得到句矩阵,将句矩阵与句矩阵的转置矩阵相乘得到交叉矩阵;基于TextRank算法对交叉矩阵进行概率转移矩阵图分解,生成句子级用户画像。本发明能够对用户画以句子的形式进行个体化、具体化、形象化等特征的描述。填补了词级、大颗粒的群体标签对个体用户心理画像描述的缺失,通过人机会话的语料,实现对个体的心理诉求进行画像,细颗粒表示了个体用户的诉求标签。