法律问题关键词生成方法及其系统

基本信息

申请号 CN201811388135.4 申请日 -
公开(公告)号 CN109543017A 公开(公告)日 2019-03-29
申请公布号 CN109543017A 申请公布日 2019-03-29
分类号 G06F16/332(2019.01)I; G06Q50/18(2012.01)I; G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 谢松县; 曾道建; 陈仲生; 彭立宏; 高辉; 桂林; 韩冰; 唐志峰; 王宁 申请(专利权)人 广州语义科技有限公司
代理机构 长沙国科天河知识产权代理有限公司 代理人 广州语义科技有限公司
地址 510623 广东省广州市天河区珠江东路32号利通广场规划设计楼32层全层单元(自编楼层34层全层单元)的E37房
法律状态 -

摘要

摘要 本发明属于自然语言处理和机器学习技术领域,涉及一种法律问题关键词生成方法,该方法包括模型训练和预测输出两个主要步骤。本发明还提供了一种法律问题关键词生成系统,该系统包括:模型训练模块和预测输出模块,其中,所述模型训练模块包括:训练集提供模块、模型训练模块以及保存模块;所述预测输出模块包括:输入与生成模块、词向量集生成模块、向量输出模块、计算模块、概率分布输出模块以及关键词输出模块。本发明具有如下有益效果:在预测输出之前,先对seq2seq模型进行训练,使得本发明可以实现抽取法律问题中不存在的关键词;在解码过程中引入强化学习,从而显著提高抽取的关键词的准确性,并添加了注意力机制,突出了学习重点。