一种基于语义分析的企业客户标签生成方法、系统及装置
基本信息
申请号 | CN202010660279.1 | 申请日 | - |
公开(公告)号 | CN111814486A | 公开(公告)日 | 2020-10-23 |
申请公布号 | CN111814486A | 申请公布日 | 2020-10-23 |
分类号 | G06F40/30(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 杜治国;吴敏;高航 | 申请(专利权)人 | 东软集团(上海)有限公司 |
代理机构 | 上海唯源专利代理有限公司 | 代理人 | 东软集团(上海)有限公司;东软集团股份有限公司 |
地址 | 200241上海市闵行区紫月路1000号1幢4层 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于语义分析的企业客户标签生成方法,所述方法包括:采用HMM算法对输入文档进行分词;计算文档中每个词的词频‑逆文档频率;根据所述词频‑逆文档频率进行关键词提取;将分词结果和关键词结果组成待摘要内容;计算待摘要内容中每个词的条件概率P(分词和关键词|待摘要内容);根据每个词的条件概率选择所需的词,生成标签。本发明有助于企业标签图谱中快速生成主营商品标签、经营状况标签、财务指标等,便于企业管理人员把握经营活动要素,也便于企业客户快速检索。 |
