基于概率的无监督缺陷预测方法

基本信息

申请号 CN201610395767.8 申请日 -
公开(公告)号 CN106021115A 公开(公告)日 2016-10-12
申请公布号 CN106021115A 申请公布日 2016-10-12
分类号 G06F11/36(2006.01)I 分类 计算;推算;计数;
发明人 徐玲;陆正发;鄢萌;杨梦宁;葛永新;洪明坚;张小洪;周末;杨丹 申请(专利权)人 重庆优霓空科技有限公司
代理机构 重庆信航知识产权代理有限公司 代理人 重庆大学;重庆优霓空科技有限公司
地址 400044 重庆市沙坪坝区正街174号
法律状态 -

摘要

摘要 本发明涉及基于概率的无监督缺陷预测方法,包括如下步骤,S1获取度量元阈值,使用每个度量下源代码类的度量元值的中位数作为阈值;S2度量元值与阈值的差值概率化;S3聚类,计算所有度量元下每个文件的概率之和,具有相同值的类归为一类;S4标记,如果某类文件所对应的概率合大于等于L,则将该类文件标记为有缺陷,否则标记为无缺陷,从而将所有类标记为有缺陷和没有缺陷的两类。本发明方法使用概率表示类存在缺陷的可能性,不同度量元值得到的概率不同,保留类存在缺陷可能性大小的信息。在标记的过程中,根据数据集中缺陷的分布特点,选取合适的临界值进行标记。在避免信息丢失的同时,选择合适的标记临界值,提高了缺陷预测的性能。