一种基于统计分析的Spark拖延任务诊断方法

基本信息

申请号 CN201811113777.3 申请日 -
公开(公告)号 CN109240890A 公开(公告)日 2019-01-18
申请公布号 CN109240890A 申请公布日 2019-01-18
分类号 G06F11/30;G06F11/34 分类 计算;推算;计数;
发明人 刘延新;李亚琼;吴昊;李守超 申请(专利权)人 江苏润和软件股份有限公司
代理机构 - 代理人 -
地址 210041 江苏省南京市雨花台区铁心桥工业园
法律状态 -

摘要

摘要 发明涉及一种基于统计分析的Spark拖延任务诊断方法,监测数据中心并行执行任务,从监测数据中推断出任务执行拖延的原因。在相同阶段,监测相同任务在不同节点的执行情况,搜集物理服务器的监测数据,分析Spark日志文件得到任务执行的监测数据。比较任务执行时间以检测拖延任务,分析拖延任务与正常执行任务的特征值的偏离程度以定位异常特征,从而诊断任务拖延的原因。