股票实体词消歧方法、计算机设备及存储介质
基本信息
申请号 | CN202011419982.X | 申请日 | - |
公开(公告)号 | CN112464669A | 公开(公告)日 | 2021-03-09 |
申请公布号 | CN112464669A | 申请公布日 | 2021-03-09 |
分类号 | G06N3/04(2006.01)I;G06F40/30(2020.01)I;G06F16/35(2019.01)I;G06F40/295(2020.01)I;G06Q40/00(2012.01)N | 分类 | 计算;推算;计数; |
发明人 | 李煜;丑晓慧 | 申请(专利权)人 | 上海深擎信息科技有限公司 |
代理机构 | 长沙国科天河知识产权代理有限公司 | 代理人 | 邱轶 |
地址 | 315000浙江省宁波市镇海区福业街55号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种股票实体词消歧方法、计算机设备及存储介质。获取包含歧义股票实体词的训练数据,从包含歧义股票实体词的训练数据中提取出所含歧义股票实体词的语义特征向量,构成训练数据集,利用该训练数据集对词判别模型进行训练。判断对待消歧金融财经资讯文本数据是否存在存在歧义词股票实体词,如存在歧义词股票实体词,将待消歧金融财经资讯文本数据及其所含的歧义股票实体词的语义特征向量输入到训练好的歧义词判别模型,判别其所含的歧义股票实体词是否是股票实体词。本发明相较于构建知识库的方式,减少了人力消耗,同时在没有使用外部知识库的情况下,依然能够对歧义实体有很强的表达能力。 |
