提案热点精准提取的方法、装置、计算机设备和存储介质

基本信息

申请号 CN202110647234.5 申请日 -
公开(公告)号 CN113190658A 公开(公告)日 2021-07-30
申请公布号 CN113190658A 申请公布日 2021-07-30
分类号 G06F16/33(2019.01)I;G06F40/216(2020.01)I;G06F40/289(2020.01)I 分类 计算;推算;计数;
发明人 刘跃华;徐艺;刘坤朋 申请(专利权)人 湖南正宇软件技术开发有限公司
代理机构 长沙国科天河知识产权代理有限公司 代理人 邱轶
地址 410000湖南省长沙市长沙高新开发区尖山路39号长沙中电软件园一期5栋701
法律状态 -

摘要

摘要 本申请涉及提案热点精准提取的方法、装置、计算机设备和存储介质。所述方法包括:根据分词库对政府文件进行分词并构建第一重点词库,将政府文件划分为多个最小词并获取其出现的第一概率,根据最小词构建组合词并获取其出现的第二概率,根据第一概率计算组合词的预测概率,第二概率大于预测概率则组合词为新词,根据新词得到更新分词库和第二重点词库,根据更新分词库对提案进行分词得到单词集,根据算法得到各单词的初始权重,根据单词集匹配第二重点词库并设置各单词的附加权重,根据初始权重和附加权重得到各单词的最终权重,根据最终权重的排序结果确定热点词。采用本方法能够快速、准确地提取提案热点。