中文企业名称的识别方法
基本信息
申请号 | CN201510614480.5 | 申请日 | - |
公开(公告)号 | CN105320645B | 公开(公告)日 | 2019-07-12 |
申请公布号 | CN105320645B | 申请公布日 | 2019-07-12 |
分类号 | G06F17/27 | 分类 | 计算;推算;计数; |
发明人 | 宋传宝;史墨轩;郝静 | 申请(专利权)人 | 天津海量信息技术股份有限公司 |
代理机构 | 天津市尚文知识产权代理有限公司 | 代理人 | 天津海量信息技术股份有限公司 |
地址 | 300020 天津市和平区南马路11号麦购国际大厦23层 | ||
法律状态 | - |
摘要
摘要 | 一种中文企业名称的识别方法,包括以下步骤:建立企业名称知识库和企业名称概率知识库,企业名称知识库中包括地名词集、企业通名词集、行业饰名词集和企业专名禁止词集,企业名称概率知识库中包括企业名称左邻词概率知识和企业名称左邻词概率知识;扫描文本,对文本进行分词;分别完成以地名饰名开头的企业名称识别和无地名饰名开头的企业名称识别。利用本发明所述的中文企业名称的识别方法可以加快文档识别中的速度,且提高了企业名称识别的准确率。 |
