一种高维特征空间中基于聚类算法的就诊人群分组方法

基本信息

申请号 CN202010469507.7 申请日 -
公开(公告)号 CN111738304A 公开(公告)日 2020-10-02
申请公布号 CN111738304A 申请公布日 2020-10-02
分类号 G06K9/62(2006.01)I;G16H10/00(2018.01)I 分类 -
发明人 陈明东;黄越 申请(专利权)人 思派健康产业投资有限公司
代理机构 北京市盛峰律师事务所 代理人 思派健康产业投资有限公司
地址 510700广东省广州市黄埔区中新广州知识产权腾飞一街2号619房
法律状态 -

摘要

摘要 本发明公开了一种高维特征空间中基于聚类算法的就诊人群分组方法,所述方法包括以下步骤,S1、以患者为汇总维度进行聚类前的特征提取,提取的特征包括疾病种类、限额使用率、个人自费占比、有无住院以及就诊间隔;S2、计算各个特征之间的相关性,依次判断各个相关性是否大于设定阈值,若是,则剔除该相关性对应的特征,并执行步骤S3;若否,则直接执行步骤S3;S3、获取聚类算法中的最优选择聚类数;S4、将最优选择聚类数输入聚类算法中,对步骤S2中的特征进行聚类,并对聚类结果分别进行业务解释。优点是:本方法中的聚类算法能够对Elbow方法中的损失函数进行归一化,且引入了类外和的概念,用以刻画描述聚类后不同类之间的距离远近。