文本扩增方法、系统、计算机设备及可读存储介质
基本信息
申请号 | CN202210233527.3 | 申请日 | - |
公开(公告)号 | CN114661917A | 公开(公告)日 | 2022-06-24 |
申请公布号 | CN114661917A | 申请公布日 | 2022-06-24 |
分类号 | G06F16/36(2019.01)I;G06F40/268(2020.01)I;G06K9/62(2022.01)I | 分类 | 计算;推算;计数; |
发明人 | 朱昱锦;徐亮 | 申请(专利权)人 | 深圳壹账通科技服务有限公司 |
代理机构 | 北京英特普罗知识产权代理有限公司 | 代理人 | - |
地址 | 518000广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司) | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种文本扩增方法,所述方法包括:获取问句,解析问句中的各个实词,标注各个实词的词性;根据各个实词的词性以及各个实词的字数,获取各个实词的关键性排序值;将关键性排序值高于预设阈值的实词作为目标实词;通过预设知识图谱或者预设提取规则,提取目标实词的同义词或者近义词;将提取到的同义词或者近义词作为扩增文本添加到机器阅读理解的通用数据集中,实现文本扩增;本发明实施例根据关键性排序值提取出问句中的关键信息,提高了机器阅读理解的识别模型给出的答案的准确性;通过关键信息查询词典或者知识图谱的方式对关键信息进行扩充,提高了识别模型给出答案的概率。 |
