模板自动生成的知识图谱问答训练及应用服务系统

基本信息

申请号 CN202010104143.2 申请日 -
公开(公告)号 CN111339269A 公开(公告)日 2020-06-26
申请公布号 CN111339269A 申请公布日 2020-06-26
分类号 G06F16/332(2019.01)I 分类 -
发明人 王杰;何韦澄;刘华根;马胜雨;景永强 申请(专利权)人 来康生命科技有限公司
代理机构 北京工信联合知识产权代理有限公司 代理人 白晓晰
地址 065001河北省廊坊市开发区金源道艾力枫社中区
法律状态 -

摘要

摘要 本发明公开了一种模板自动生成的知识图谱问答训练系统,包括:谓词词典和类别词典的构建模块,用于使用远程监督的方式分别构建谓语词典和类别词典;骨干查询生成模块,用于获取每一条训练问答对的主题实体和答案实体在知识图谱中的子图,使用变量代替子图中的答案节点,形成骨干查询;语义对齐模块;用于使用依存句法分析和整形线性对齐技术将问句短语和主干查询语义元素对齐;模板泛华模块,将依存句法树、骨干查询、以及所述对应关系作为模板存入模板库;排序模型训练模块,用于使用机器学习二分类器对每两个匹配模板,根据匹配度高低进行分类学习,获取问句模板排序模型,解决现有技术人工成本高,问题覆盖率低的问题。