一种文档处理方法、装置、设备及存储介质

基本信息

申请号 CN202111494819.4 申请日 -
公开(公告)号 CN114153947A 公开(公告)日 2022-03-08
申请公布号 CN114153947A 申请公布日 2022-03-08
分类号 G06F16/33(2019.01)I;G06F40/216(2020.01)I 分类 计算;推算;计数;
发明人 王超;郑力;杨声春;游佳川;何诺;覃杨微;徐欣欣;王璇;刘馨杨;袁文忆 申请(专利权)人 重庆农村商业银行股份有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 吴磊
地址 400000重庆市江北区金沙门路36号
法律状态 -

摘要

摘要 本发明公开了一种文档处理方法、装置、设备及存储介质,该方法包括:确定需要检索的各文档分别为待检索文档;将各待检索文档分别输入至词权重模型中,得到所述词权重模型输出的相应待检索文档中各个词的词权重;将已得到所包含的各个词的词权重的各待检索文档均加入至知识库中,以供基于所包含的各个词的词权重在所述知识库中实现待检索文档的检索;其中,所述词权重模型为预先利用多个文本及相应文本中各个词的词权重训练得到的。可见,对于需要检索的文档,本申请能够利用模型得到能够有效表示其中各个词的重要程度的词权重,进而在需要时基于得到的各个词的词权重实现相应文档的检索,能够有效提高信息检索准确率。