一种语料生成方法及装置
基本信息
申请号 | CN202110808793.X | 申请日 | - |
公开(公告)号 | CN113486656A | 公开(公告)日 | 2021-10-08 |
申请公布号 | CN113486656A | 申请公布日 | 2021-10-08 |
分类号 | G06F40/284(2020.01)I;G06F16/36(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 张江滨;施登亮;赵智源;祝慧佳 | 申请(专利权)人 | 支付宝(杭州)信息技术有限公司 |
代理机构 | 北京亿腾知识产权代理事务所(普通合伙) | 代理人 | 陈霁;周良玉 |
地址 | 310000浙江省杭州市西湖区西溪路556号8层B段801-11 | ||
法律状态 | - |
摘要
摘要 | 本说明书实施例提供了一种语料生成方法及装置,该方法包括:获取原始文本;对原始文本进行关键词匹配,从而确定出原始文本中的违规关键词以及其对应的基本关键词,基本关键词对应于违规关键词的正确形态;确定基本关键词的违规要素,并确定出与基本关键词关于违规要素存在关联的关联关键词;对关联关键词进行文本变种,获取变种文本;以变种文本,替换原始文本中的违规关键词,生成语料文本。 |
