语言形态分析器

基本信息

申请号 CN200510135590.X 申请日 -
公开(公告)号 CN1991819A 公开(公告)日 2007-07-04
申请公布号 CN1991819A 申请公布日 2007-07-04
分类号 G06F17/27(2006.01) 分类 计算;推算;计数;
发明人 毛新年;李珩;董远 申请(专利权)人 北京法国电信研发中心有限公司
代理机构 北京市柳沈律师事务所 代理人 窦杰平
地址 100080北京市海淀区科学院南路2号融科资讯中心C座南楼10层
法律状态 -

摘要

摘要 本发明提供了一种自然语言形态分析器和一种通过计算机根据形态词构词语法从文本中识别和提取所述语言的形态词(MDW)的方法,所述方法包括以下步骤:加载形态词构词语法的计算机可读规则;输入文本,并且按照该语言的标点符号来从输入文本获得句子;形成每个句子的词格,所述词格包括至少一个元素,每个元素对应于句子中一个字或一个可能的词;通过使用与所加载的形态词构词语法规则相结合的表解析算法来解析每个句子的词格以从词格的一个或多个元素中获得MDW候选词;以及输出所获得的MDW候选词。本发明可以有效且高效地从文本识别和提取MDW,并且迅速获得MDW的句法、语义和形态模式信息。