一种构建标签数据库的方法和装置

基本信息

申请号 CN202110408897.1 申请日 -
公开(公告)号 CN113051253A 公开(公告)日 2021-06-29
申请公布号 CN113051253A 申请公布日 2021-06-29
分类号 G06F16/21;G06F16/2457 分类 计算;推算;计数;
发明人 何军;江同飞 申请(专利权)人 广州云族佳科技有限公司
代理机构 北京超凡宏宇专利代理事务所(特殊普通合伙) 代理人 徐丽
地址 510700 广东省广州市黄埔区护林路1010号310室
法律状态 -

摘要

摘要 本发明提供了一种构建标签数据库的方法和装置,包括:获取开源代码信息;将开源代码信息通过抽象语法树进行解析,得到特征语句;根据特征语句构建依赖模块数据库;对依赖模块数据库中的依赖模块进行标签提取,得到备选标签;从备选标签中选取技术标签;根据技术标签确定技术领域和实现功能;其中,依赖模块用于表征引入第三方库的语句,通过构建依赖模块数据库可以减少人工采集的工作量,通过依赖模块数据库对标签进行标定得到备选标签,根据备选标签进行判断或校正,提高效率和准确率。