一种基于深度学习的从非结构化文本中获取问答对的方法

基本信息

申请号 CN201910220102.7 申请日 -
公开(公告)号 CN110110054B 公开(公告)日 2021-06-08
申请公布号 CN110110054B 申请公布日 2021-06-08
分类号 G06F16/332;G06F40/289;G06F40/211;G06N3/04 分类 计算;推算;计数;
发明人 王丙栋;朱江平;游世学 申请(专利权)人 北京中科汇联科技股份有限公司
代理机构 北京庆峰财智知识产权代理事务所(普通合伙) 代理人 李文军
地址 100094 北京市海淀区东北旺西路8号9号楼二区305
法律状态 -

摘要

摘要 本发明涉及一种基于深度学习的从非结构化文本中获取问答对的方法,包括如下步骤:文本规格化处理;基于深度神经网络模型进行句子分类和配对及关键短语提取;文本内部的问答对获取;文本外部的问答对爬取;问答对汇总去重。本发明,针对问答对获取困难的问题,通过有效利用容易获取的非结构化文档资源,结合使用深度神经网络模型,自动高效地获取成规模的问答对,供人工校对、补充使用,降低了构建知识库的成本,加快了构建知识库的构建速度。