基于文本的行业类别识别方法及装置
基本信息
申请号 | CN202111150329.2 | 申请日 | - |
公开(公告)号 | CN113836305A | 公开(公告)日 | 2021-12-24 |
申请公布号 | CN113836305A | 申请公布日 | 2021-12-24 |
分类号 | G06F16/35(2019.01)I;G06F40/30(2020.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 黄于晏;陈莹莹;李展铿 | 申请(专利权)人 | 有米科技股份有限公司 |
代理机构 | 广州三环专利商标代理有限公司 | 代理人 | 肖宇扬;江银会 |
地址 | 510006广东省广州市番禺区小谷围街青蓝街26号1701 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于文本的行业类别识别方法及装置,通过分别提取待识别行业的文本中的中文文本词向量集合和英文文本词向量集合,再根据英文文本词向量集合的长度和中文文本词向量集合的长度,去确定与待识别行业的文本匹配的行业类别,能够提高识别出与文本匹配的行业类别的准确性,有利于提高对不同行业的文本(如广告文本)中蕴含的品牌和品类进行探索的准确性及可靠性,以及无需对英文文本进行翻译,直接使用英文行业识别模型对英文文本进行分析,能够提高英文文本的分析效率以及准确性。 |
