一种基于内容的计算移动应用相似性的方法

基本信息

申请号 CN201510776878.9 申请日 -
公开(公告)号 CN105677695A 公开(公告)日 2016-06-15
申请公布号 CN105677695A 申请公布日 2016-06-15
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 吴明晖;刘泽民;金苍宏;应晶 申请(专利权)人 杭州圆橙科技有限公司
代理机构 杭州宇信知识产权代理事务所(普通合伙) 代理人 杭州圆橙科技有限公司
地址 310016 浙江省杭州市上城区海潮路53号274室
法律状态 -

摘要

摘要 本发明涉及一种基于内容的计算移动应用相似性的方法。包括如下步骤:在获取大量移动应用信息后,进行移动应用信息的提取,包括应用名称、应用类型、应用描述和应用大小等;将应用描述信息进行分词;将分词完毕后的内容分为两份,一份整合后作为word2vec的模型的训练语料,另一份存成文档集的形式并进行TF-IDF的计算,然后将结果存入HBase数据仓库;进行app相似性查询及计算。实施本发明的一种基于内容的计算移动应用相似性的方法,具有以下有益效果:可以快速的响应app的相似性查询,基于内容的app特征及描述信息能够很好地代指app,准确率高,可提高app的搜索及推荐的准确率。