一种基于语义相似性扩展的商品名称分类方法及系统

基本信息

申请号 CN201710943802.X 申请日 -
公开(公告)号 CN107657284A 公开(公告)日 2018-02-02
申请公布号 CN107657284A 申请公布日 2018-02-02
分类号 G06K9/62;G06F17/27 分类 计算;推算;计数;
发明人 庞胜民;王涛;王芳;李纪超;高哲;张浩 申请(专利权)人 宁波爱信诺航天信息有限公司
代理机构 宁波高新区核心力专利代理事务所(普通合伙) 代理人 宁波爱信诺航天信息有限公司;航天信息股份有限公司
地址 315000 浙江省宁波市高新区光华路299弄14幢34、35号
法律状态 -

摘要

摘要 本发明公开了一种基于语义相似性扩展的商品名称分类方法及系统。本发明对已有类别的商品的历史发票数据集进行离线算法计算得到每类商品的朴素贝叶斯模型和词向量。分情况分析商户输入的商品品名词向量是否存在在已有类别的商品的朴素贝叶斯模型内,若朴素贝叶斯模型没有该商品名分词后的单元词,则将该商品名与已有商品类别关键词进行词向量相似度计算,求出商户输入的商品名属于已有商品类别的概率,其最大值所对应的类别即为商品所属类别。实验结果表明,基于语义扩展的商品类别关键词相似度计算准确率较高,而且计算结果符合常识判断。