从金融资讯提取脉络信息的方法和装置
基本信息
申请号 | CN202010264403.2 | 申请日 | - |
公开(公告)号 | CN111401055A | 公开(公告)日 | 2020-07-10 |
申请公布号 | CN111401055A | 申请公布日 | 2020-07-10 |
分类号 | G06F40/284(2020.01)I | 分类 | - |
发明人 | 柴志伟;赵路路;丑晓慧;许冠宇 | 申请(专利权)人 | 上海深擎信息科技有限公司 |
代理机构 | 长沙国科天河知识产权代理有限公司 | 代理人 | 宁波深擎信息科技有限公司;上海深擎信息科技有限公司 |
地址 | 315000浙江省宁波市镇海区福业街55号 | ||
法律状态 | - |
摘要
摘要 | 本申请涉及一种从金融资讯提取脉络信息的方法和装置。所述方法包括:获取金融资讯;提取文本内容中包含的关键词,根据金融领域的知识图谱,对关键词进行匹配,得到关键词汇,以关键词汇为初始节点,采用深度优先搜索法搜索预设深度内为公司名称的节点,根据公司名称对应的节点,构建资讯脉络图,采用广度优先搜索法计算初始节点到公司名称的节点的最短路径,选择最短路径中二级以上的连接路径,分别获取关键词汇的词汇向量和连接路径对应的路径向量,根据词汇向量和路径向量的相似度,确定与关键词汇相似的连接路径。采用本方法能够从金融资讯中提取脉络信息。 |
