问句语义解析规则模板的生成方法、装置、设备及存储介质
基本信息
申请号 | CN202010992511.1 | 申请日 | - |
公开(公告)号 | CN111858900B | 公开(公告)日 | 2020-10-30 |
申请公布号 | CN111858900B | 申请公布日 | 2020-10-30 |
分类号 | G06F16/332(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 高鹏;康维鹏;周伟华;潘晶;袁兰;高峰 | 申请(专利权)人 | 杭州摸象大数据科技有限公司 |
代理机构 | 杭州知学知识产权代理事务所(普通合伙) | 代理人 | 杭州摸象大数据科技有限公司 |
地址 | 311300浙江省杭州市余杭区余杭街道文一西路1818-2号中国人工智能小镇6-6楼 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了问句语义解析规则模板的生成方法、装置、设备及存储介质,方法包括:采集线上问句,对每个所述问句进行分词、词性及词语拼音识别;统计各词语的词频,基于所述词频及词性,确定重要词语列表,确定所述重要词语列表中各词语出当前问句中的百分比位置信息及方差;遍历每个线上问句,基于所述重要词语列表生成泛化规则模版;基于泛化能力对所述泛化规则模版进行筛选得到第一过滤规则模版;基于匹配准确率对所述第一过滤规则模版进行筛选得到问句语义解析规则模板。本发明从线上问句库中,自动挖掘产生高质量规则匹配模板,并通过自动策略产生一个泛化力、解析准确率都较高的规则模板,从而从根源上解决了现有的线上问句解析问题。 |
