文本行语种识别方法、装置、电子设备
基本信息
申请号 | CN202110650294.2 | 申请日 | - |
公开(公告)号 | CN113468979A | 公开(公告)日 | 2021-10-01 |
申请公布号 | CN113468979A | 申请公布日 | 2021-10-01 |
分类号 | G06K9/00(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 黄荔;刘正珍 | 申请(专利权)人 | 汉王科技股份有限公司 |
代理机构 | 北京润泽恒知识产权代理有限公司 | 代理人 | 莎日娜 |
地址 | 100193北京市海淀区东北旺西路8号5号楼三层 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种文本行语种识别方法,属于计算机视觉技术领域,有助于提升图像中文本行语种识别的准确度。所述方法包括:通过预设深度学习网络的特征提取模块,对目标文本图像进行特征提取和融合处理,得到第一向量表示;通过该网络的第一分类模块对第一向量表示进行二分类映射,确定目标文本图像的二类别概率预测图;基于二类别概率预测图,通过该网络的注意力模块对第一向量表示中对应前景像素点的向量进行加权处理,得到第二向量表示;通过该网络的第二分类模块对第二向量表示进行多分类映射,确定多类别概率预测图;根据多类别概率预测图,确定目标文本图像中匹配各预设语种的文本行的位置信息,提升了图像中文本行及语种识别准确度。 |
