基于汉语含义的汉语编码处理方法及系统
基本信息
申请号 | CN201710856828.0 | 申请日 | - |
公开(公告)号 | CN109086257A | 公开(公告)日 | 2018-12-25 |
申请公布号 | CN109086257A | 申请公布日 | 2018-12-25 |
分类号 | G06F17/22 | 分类 | 计算;推算;计数; |
发明人 | 夏铨真 | 申请(专利权)人 | 佛山辞荟源信息科技有限公司 |
代理机构 | 北京润川律师事务所 | 代理人 | 陈振;张超 |
地址 | 528300 广东省佛山市顺德区大良街道五沙社区新辉路8号(地号北-7-2)之四 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种基于汉语含义的汉语编码方法和系统。该方法包括如下步骤:分析汉语多个含义属性,检出语素,定义并编码每个语素,所述语素编码为中性码;使用语素编码(中性码)设置汉语词及短语的编码,得到编码化的汉语词和短语,即词句码;对中性码进行分类汇总链接,结合词句码,形成基于语义编码的语素数据库。其语言信息的处理方便、细腻、灵活,能够进行语言大数据的搜索、分析、统计,拥有遨游语言大关系数据库的超强功能,能够有力地提升其价值。 |
