代码文本处理方法及相关产品

基本信息

申请号 CN201911290957.3 申请日 -
公开(公告)号 CN111126031A 公开(公告)日 2020-05-08
申请公布号 CN111126031A 申请公布日 2020-05-08
分类号 G06F40/194;G06F8/75 分类 计算;推算;计数;
发明人 于俊;连顺;李雅洁;谭昶;谢榭;丁辉 申请(专利权)人 南京谦萃智能科技服务有限公司
代理机构 广州三环专利商标代理有限公司 代理人 南京谦萃智能科技服务有限公司
地址 210000 江苏省南京市建邺区江心州贤坤路1号科创中心2楼220-50号办公用房
法律状态 -

摘要

摘要 本申请实施例公开了一种代码文本处理方法及相关产品,方法包括:首先获取两个第一代码文本,之后,确定两个第一代码文本中每个第一代码文本的第一文本特征,第一文本特征用于表征文本的结构特征,结构特征用于反映文本的组成成分,然后,将两个第一代码文本导入预先训练好的文本特征提取模型,得到两个第一代码文本中每个第一代码文本的第二文本特征,第二文本特征用于表征文本的语义特征,最后,根据两个第一代码文本的第一文本特征和第二文本特征,得到两个第一代码文本对应的目标相似度。本申请实施例有利于提升代码文本相似性计算的精准度。