文本标点预测方法、装置、系统及存储介质
基本信息
申请号 | CN202110555504.X | 申请日 | - |
公开(公告)号 | CN113378541A | 公开(公告)日 | 2021-09-10 |
申请公布号 | CN113378541A | 申请公布日 | 2021-09-10 |
分类号 | G06F40/20(2020.01)I;G06F40/289(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 何梦中;李秀林;吴本谷 | 申请(专利权)人 | 标贝(北京)科技有限公司 |
代理机构 | 北京睿邦知识产权代理事务所(普通合伙) | 代理人 | 徐丁峰;戴亚南 |
地址 | 100192北京市海淀区西小口路66号中关村东升科技园·北领地B-2楼3层B303A | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种文本标点预测方法、装置、系统及存储介质。方法包括:获取待处理文本;按照文本段对待处理文本进行划分,文本段是单个词或单个字符;将文本划分结果输入标点预测模型,以获得与待处理文本中的所有文本段一一对应的初始预测结果,初始预测结果包括与N个预设标点一一对应的N个预测概率,每个预测概率表示对应文本段后面的标点是对应预设标点的概率,N为大于1的正整数;对待处理文本中的至少部分文本段所对应的初始预测结果进行平滑处理,以获得与待处理文本中的所有文本段一一对应的最终预测结果;基于待处理文本中的所有文本段所对应的最终预测结果确定待处理文本包含的标点,以获得标点预测结果。有助于提高标点预测的准确率。 |
