一种比较中药处方相似性的方法

基本信息

申请号 CN202110553551.0 申请日 -
公开(公告)号 CN113554053A 公开(公告)日 2021-10-26
申请公布号 CN113554053A 申请公布日 2021-10-26
分类号 G06K9/62(2006.01)I;G06F40/216(2020.01)I;G06F40/289(2020.01)I;G06F40/126(2020.01)I 分类 计算;推算;计数;
发明人 李天泉;杨建明;史晓雨;张好霞;郭诗琦;陈浩 申请(专利权)人 重庆康洲大数据(集团)有限公司
代理机构 北京汇泽知识产权代理有限公司 代理人 武君
地址 401336重庆市南岸区玉马路8号B栋第二层
法律状态 -

摘要

摘要 本发明公开了一种比较中药处方相似性的方法,包括:对中药处方数据库中的中药处方文本进行分词,生成词汇表;根据所述词汇表生成药材分词向量;计算每个处方中的药材分词向量的分词权重;根据所述药材的分词向量与对应的所述分词权重生成处方的短文本向量;获取短文本向量之间的相互关联程度;根据所述短文本向量之间的相互关联程度计算处方相似度。本发明提供一种比较中药处方相似性的方法,用one‑hot编码处理处方中药材的词向量,再利用TF‑IDF和Word2Vec进行处方短文本特性向量,最后采用计算信息增益的方法计算处方短文本向量的关联程度,归一化后得到处方之间的相似度,将比较结果和解释展示给用户,实现了更加高效、快捷、准确的实现中药处方的相似度比较功能。