一种全自动汉语分词系统

基本信息

申请号 CN96100831.8 申请日 -
公开(公告)号 CN1107276C 公开(公告)日 2003-04-30
申请公布号 CN1107276C 申请公布日 2003-04-30
分类号 G06F17/27 分类 计算;推算;计数;
发明人 陈肇雄;黄河燕 申请(专利权)人 华建机器翻译有限公司
代理机构 北京北新智诚专利 代理人 华建机器翻译有限公司;北京华建长河科技有限公司
地址 100083北京市海淀区学院路30号科群大厦西楼华建集团公司李华
法律状态 -

摘要

摘要 一种全自动汉语分词系统,包括(1)汉语源语输入装置,(2)自动断句装置,(3)将句子字符转变成图结点的结点结构生成装置,(4)确定词长的边求解装置,在边求解的同时,进行歧义判断,并做相应的歧义标识,(5)推理消歧装置,(6)结果输出装置。该系统能高效、灵活、准确地将句子切分成词序列,为准确地翻译打下良好的基础。