代码文本处理方法及相关产品
基本信息
申请号 | CN201911290957.3 | 申请日 | - |
公开(公告)号 | CN111126031A | 公开(公告)日 | 2020-05-08 |
申请公布号 | CN111126031A | 申请公布日 | 2020-05-08 |
分类号 | G06F40/194;G06F8/75 | 分类 | 计算;推算;计数; |
发明人 | 于俊;连顺;李雅洁;谭昶;谢榭;丁辉 | 申请(专利权)人 | 南京谦萃智能科技服务有限公司 |
代理机构 | 广州三环专利商标代理有限公司 | 代理人 | 南京谦萃智能科技服务有限公司 |
地址 | 210000 江苏省南京市建邺区江心州贤坤路1号科创中心2楼220-50号办公用房 | ||
法律状态 | - |
摘要
摘要 | 本申请实施例公开了一种代码文本处理方法及相关产品,方法包括:首先获取两个第一代码文本,之后,确定两个第一代码文本中每个第一代码文本的第一文本特征,第一文本特征用于表征文本的结构特征,结构特征用于反映文本的组成成分,然后,将两个第一代码文本导入预先训练好的文本特征提取模型,得到两个第一代码文本中每个第一代码文本的第二文本特征,第二文本特征用于表征文本的语义特征,最后,根据两个第一代码文本的第一文本特征和第二文本特征,得到两个第一代码文本对应的目标相似度。本申请实施例有利于提升代码文本相似性计算的精准度。 |
