获取预定义字符数据的方法和装置

基本信息

申请号 CN200910243515.3 申请日 -
公开(公告)号 CN102110103B 公开(公告)日 2014-04-09
申请公布号 CN102110103B 申请公布日 2014-04-09
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 马腾飞;万小军;杨建武;肖建国 申请(专利权)人 北京方正电子政务信息科技有限公司
代理机构 北京康信知识产权代理有限责任公司 代理人 北京大学;北大方正集团有限公司;北京方正电子政务信息科技有限公司;北京北大方正电子有限公司
地址 100871 北京市海淀区颐和园路5号
法律状态 -

摘要

摘要 本发明提供了一种获取预定义字符数据的方法和装置,本发明的方法包括:对待处理字符数据进行词性标注,划分出显性字符数据或/和隐性字符数据;从所述显性字符数据中查找出具有预定义字符数据类型的数据,作为所述显性字符数据的预定义字符数据;从基准字符数据的中心实体中查找出具有所述预定义字符数据类型的数据,作为与所述隐性字符数据相对应的预定义字符数据。本发明还提供一种获取预定义字符数据的装置。本发明可按照用户的需求,选择预定义类型的字符数据,对于处理语法形式不规则的句子,尤其是句子中本身不存在显性对象的句子,提高了获得的结果范围、准确度。