汉语句子混合模板的挖掘方法及装置

基本信息

申请号 CN201810201422.3 申请日 -
公开(公告)号 CN108563617B 公开(公告)日 2021-09-21
申请公布号 CN108563617B 申请公布日 2021-09-21
分类号 G06F40/216;G06F40/211;G06F40/284;G06F40/295;G06F40/186 分类 计算;推算;计数;
发明人 任禾 申请(专利权)人 云知声智能科技股份有限公司
代理机构 - 代理人 -
地址 100096 北京市海淀区西三旗建材城内1幢一层101号
法律状态 -

摘要

摘要 本发明提供了一种汉语句子混合模板的挖掘方法及装置,其中,该方法包括:获取预设文本,所述预设文本包括正例文本和负例文本;对预设文本中的每个句子分别进行分析处理,确定句子的每个词语的词语参数;根据所有词语的词语参数生成句子的候选模板;根据所有句子的所有候选模板合并生成不含有重复候选模板的模板列表,并生成正例模板集和负例模板集;从模板列表中选取目标候选模板,根据目标候选模板的正例次数和负例次数确定目标候选模板的模板类型。该方法生成的句子模板是词、词性、命名实体和句法依赖关系的混合表达,可以更加充分地刻画一个句子中存在的语言规律,模板匹配能力强。