一种分词方法、装置、设备及计算机存储介质
基本信息
申请号 | CN202010887529.5 | 申请日 | - |
公开(公告)号 | CN112069812A | 公开(公告)日 | 2020-12-11 |
申请公布号 | CN112069812A | 申请公布日 | 2020-12-11 |
分类号 | G06F40/284(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 王哲;覃志奎;张炫;李波;曾少斌;胡俊;颜杰;刘鸿;未波波;杨鹏伟;钟剑哲;乔柯岩;冯子剑;郭琳琳;赵向洋;李朋;张红玉;苏盈盈 | 申请(专利权)人 | 喜大(上海)网络科技有限公司 |
代理机构 | 北京品源专利代理有限公司 | 代理人 | 喜大(上海)网络科技有限公司 |
地址 | 201203上海市浦东新区中国(上海)自由贸易试验区丹桂路799号2幢2层 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例公开了一种分词方法、装置、设备及计算机存储介质。该方法包括:划分获取的中文文本,得到以每个字符为起点并且可以成词的候选切片集合;循环遍历各所述候选切片集合,得到候选分词结果;确定所述候选分词结果中各候选切片长度的乘积值,并将乘积值最大的候选分词结果作为所述中文文本的目标分词结果。上述方案选取分词结果中长度乘积值最大的作为中文文本的目标分词结果,实现了分词结果的全局最优,提高了分词结果的准确度。 |
