基于汉语含义的汉语编码处理方法及系统

基本信息

申请号 CN201710856828.0 申请日 -
公开(公告)号 CN109086257A 公开(公告)日 2018-12-25
申请公布号 CN109086257A 申请公布日 2018-12-25
分类号 G06F17/22 分类 计算;推算;计数;
发明人 夏铨真 申请(专利权)人 佛山辞荟源信息科技有限公司
代理机构 北京润川律师事务所 代理人 陈振;张超
地址 528300 广东省佛山市顺德区大良街道五沙社区新辉路8号(地号北-7-2)之四
法律状态 -

摘要

摘要 本发明提供了一种基于汉语含义的汉语编码方法和系统。该方法包括如下步骤:分析汉语多个含义属性,检出语素,定义并编码每个语素,所述语素编码为中性码;使用语素编码(中性码)设置汉语词及短语的编码,得到编码化的汉语词和短语,即词句码;对中性码进行分类汇总链接,结合词句码,形成基于语义编码的语素数据库。其语言信息的处理方便、细腻、灵活,能够进行语言大数据的搜索、分析、统计,拥有遨游语言大关系数据库的超强功能,能够有力地提升其价值。