提案热点精准提取的方法、装置、计算机设备和存储介质
基本信息
申请号 | CN202110647234.5 | 申请日 | - |
公开(公告)号 | CN113190658A | 公开(公告)日 | 2021-07-30 |
申请公布号 | CN113190658A | 申请公布日 | 2021-07-30 |
分类号 | G06F16/33(2019.01)I;G06F40/216(2020.01)I;G06F40/289(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 刘跃华;徐艺;刘坤朋 | 申请(专利权)人 | 湖南正宇软件技术开发有限公司 |
代理机构 | 长沙国科天河知识产权代理有限公司 | 代理人 | 邱轶 |
地址 | 410000湖南省长沙市长沙高新开发区尖山路39号长沙中电软件园一期5栋701 | ||
法律状态 | - |
摘要
摘要 | 本申请涉及提案热点精准提取的方法、装置、计算机设备和存储介质。所述方法包括:根据分词库对政府文件进行分词并构建第一重点词库,将政府文件划分为多个最小词并获取其出现的第一概率,根据最小词构建组合词并获取其出现的第二概率,根据第一概率计算组合词的预测概率,第二概率大于预测概率则组合词为新词,根据新词得到更新分词库和第二重点词库,根据更新分词库对提案进行分词得到单词集,根据算法得到各单词的初始权重,根据单词集匹配第二重点词库并设置各单词的附加权重,根据初始权重和附加权重得到各单词的最终权重,根据最终权重的排序结果确定热点词。采用本方法能够快速、准确地提取提案热点。 |
