专用术语无监督聚类方法、装置和系统
基本信息
申请号 | CN202110921653.3 | 申请日 | - |
公开(公告)号 | CN113377929A | 公开(公告)日 | 2021-09-10 |
申请公布号 | CN113377929A | 申请公布日 | 2021-09-10 |
分类号 | G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06K9/62(2006.01)I;G06K9/32(2006.01)N | 分类 | 计算;推算;计数; |
发明人 | 陈冠伟 | 申请(专利权)人 | 好心情健康产业集团有限公司 |
代理机构 | 北京和信华成知识产权代理事务所(普通合伙) | 代理人 | 李莹 |
地址 | 100080北京市海淀区北四环西路52号16层1601、1602房间 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种专用术语无监督聚类方法、装置和系统,对文本进行预处理,建立业务专用术语词汇集合,所述集合包括词汇的语义信息和词序信息,词汇由单词组成,建立单词‑单词的语义矩阵,对语义矩阵进行模型预训练得到语义关系矩阵,计算单词‑单词的词序关系矩阵,通过无监督聚类算法对语义关系矩阵和词序关系矩阵进行聚类,将单词的语义信息和词序信息通过关系矩阵的方式进行提取,利用IRM算法对两个关系矩阵进行无监督分类,完成单词类别的提取。 |
