一种基于语义分析的企业客户标签生成方法、系统及装置

基本信息

申请号 CN202010660279.1 申请日 -
公开(公告)号 CN111814486A 公开(公告)日 2020-10-23
申请公布号 CN111814486A 申请公布日 2020-10-23
分类号 G06F40/30(2020.01)I 分类 计算;推算;计数;
发明人 杜治国;吴敏;高航 申请(专利权)人 东软集团(上海)有限公司
代理机构 上海唯源专利代理有限公司 代理人 东软集团(上海)有限公司;东软集团股份有限公司
地址 200241上海市闵行区紫月路1000号1幢4层
法律状态 -

摘要

摘要 本发明公开了一种基于语义分析的企业客户标签生成方法,所述方法包括:采用HMM算法对输入文档进行分词;计算文档中每个词的词频‑逆文档频率;根据所述词频‑逆文档频率进行关键词提取;将分词结果和关键词结果组成待摘要内容;计算待摘要内容中每个词的条件概率P(分词和关键词|待摘要内容);根据每个词的条件概率选择所需的词,生成标签。本发明有助于企业标签图谱中快速生成主营商品标签、经营状况标签、财务指标等,便于企业管理人员把握经营活动要素,也便于企业客户快速检索。