句模提取方法及装置

基本信息

申请号 CN201810964831.9 申请日 -
公开(公告)号 CN109190099A 公开(公告)日 2019-01-11
申请公布号 CN109190099A 申请公布日 2019-01-11
分类号 G06F17/24;G06F17/27 分类 计算;推算;计数;
发明人 梅阳阳;谢德刚;郑文娟 申请(专利权)人 上海互教智能科技有限公司
代理机构 - 代理人 -
地址 201210 上海市浦东新区中国(上海)自由贸易试验区张江路368号29幢211室
法律状态 -

摘要

摘要 一种句模提取方法,用于对数学题目文本的句模提取,包括以下步骤:S1,首选进行预处理,采用词典与算法相结合的方法对数学题目进行序列标注、分词和分句,并做标准化处理;S2,基于分词和分句结果,计算词对的互信息,初步筛选出句模,并根据句模出现次数确定句模。本发明根据数学短语化句式的特点和对文本序列标注结果的预处理,可以有效地提取数学领域中的句子模板,大大提高了对数学题目知识表达的逻辑谓词的提取效果,促进了自动解题系统对题意的准确理解,相比传统人工总结编写句模的方法适用性更广,可以有效地推动了自然语言处理领域中的关键技术针对数学领域的研究和应用。