句子级用户画像生成方法、装置及存储介质
基本信息
申请号 | CN202110171840.4 | 申请日 | - |
公开(公告)号 | CN112989038A | 公开(公告)日 | 2021-06-18 |
申请公布号 | CN112989038A | 申请公布日 | 2021-06-18 |
分类号 | G06F16/35;G06F16/33;G06F40/289;G06F17/16 | 分类 | 计算;推算;计数; |
发明人 | 徐涛 | 申请(专利权)人 | 浙江连信科技有限公司 |
代理机构 | 北京知果之信知识产权代理有限公司 | 代理人 | 卜荣丽;李志刚 |
地址 | 310051 浙江省杭州市滨江区西兴街道丹枫路399号3号楼901室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种句子级用户画像生成方法、装置及存储介质,包括:接收会话语料,基于爬虫系统对所述会话语料进行处理获取目标语料,其中目标语料包括一个或多个文本;对文本进行分词处理,获得每个文本分词的词向量,基于每个文本分词的词向量生成该文本的句向量;将句向量转换为矩阵得到句矩阵,将句矩阵与句矩阵的转置矩阵相乘得到交叉矩阵;基于TextRank算法对交叉矩阵进行概率转移矩阵图分解,生成句子级用户画像。本发明能够对用户画以句子的形式进行个体化、具体化、形象化等特征的描述。填补了词级、大颗粒的群体标签对个体用户心理画像描述的缺失,通过人机会话的语料,实现对个体的心理诉求进行画像,细颗粒表示了个体用户的诉求标签。 |
