一种基于内容的计算移动应用相似性的方法
基本信息
申请号 | CN201510776878.9 | 申请日 | - |
公开(公告)号 | CN105677695B | 公开(公告)日 | 2019-03-08 |
申请公布号 | CN105677695B | 申请公布日 | 2019-03-08 |
分类号 | G06F16/242(2019.01)I; G06F16/21(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 吴明晖; 刘泽民; 金苍宏; 应晶 | 申请(专利权)人 | 杭州圆橙科技有限公司 |
代理机构 | 杭州宇信知识产权代理事务所(普通合伙) | 代理人 | 杭州圆橙科技有限公司 |
地址 | 310016 浙江省杭州市上城区海潮路53号274室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种基于内容的计算移动应用相似性的方法。包括如下步骤:在获取大量移动应用信息后,进行移动应用信息的提取,包括应用名称、应用类型、应用描述和应用大小等;将应用描述信息进行分词;将分词完毕后的内容分为两份,一份整合后作为word2vec的模型的训练语料,另一份存成文档集的形式并进行TF‑IDF的计算,然后将结果存入HBase数据仓库;进行app相似性查询及计算。实施本发明的一种基于内容的计算移动应用相似性的方法,具有以下有益效果:可以快速的响应app的相似性查询,基于内容的app特征及描述信息能够很好地代指app,准确率高,可提高app的搜索及推荐的准确率。 |
