专用术语无监督聚类方法、装置和系统

基本信息

申请号 CN202110921653.3 申请日 -
公开(公告)号 CN113377929A 公开(公告)日 2021-09-10
申请公布号 CN113377929A 申请公布日 2021-09-10
分类号 G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06K9/62(2006.01)I;G06K9/32(2006.01)N 分类 计算;推算;计数;
发明人 陈冠伟 申请(专利权)人 好心情健康产业集团有限公司
代理机构 北京和信华成知识产权代理事务所(普通合伙) 代理人 李莹
地址 100080北京市海淀区北四环西路52号16层1601、1602房间
法律状态 -

摘要

摘要 本发明公开一种专用术语无监督聚类方法、装置和系统,对文本进行预处理,建立业务专用术语词汇集合,所述集合包括词汇的语义信息和词序信息,词汇由单词组成,建立单词‑单词的语义矩阵,对语义矩阵进行模型预训练得到语义关系矩阵,计算单词‑单词的词序关系矩阵,通过无监督聚类算法对语义关系矩阵和词序关系矩阵进行聚类,将单词的语义信息和词序信息通过关系矩阵的方式进行提取,利用IRM算法对两个关系矩阵进行无监督分类,完成单词类别的提取。