一种基于作业调度系统的应用作业控制系统及其控制方法

基本信息

申请号 CN201210333454.1 申请日 -
公开(公告)号 CN102880506B 公开(公告)日 2016-09-21
申请公布号 CN102880506B 申请公布日 2016-09-21
分类号 G06F9/46(2006.01)I 分类 计算;推算;计数;
发明人 张磊;张涛 申请(专利权)人 曙光智算信息技术有限公司
代理机构 北京安博达知识产权代理有限公司 代理人 曙光信息产业(北京)有限公司
地址 100193 北京市海淀区东北旺西路8号中关村软件园36号
法律状态 -

摘要

摘要 本发明涉及一种基于作业调度系统的应用作业控制系统及其控制方法,控制系统包括组播消息发送器、应用程序监控器和作业调度系统;当组播消息发送器被应用程序作业调用后,向组播域发送组播消息;应用程序监控器中的应用监听器接收所述组播消息并将其发送到应用程序监控器中的消息分析器中;消息分析器判定所述组播消息运行状态是否正常,若处于异常状态,则通过所述作业调度系统将该应用程序作业Rerun;该方法解决了现有调度系统仅从作业的角度为使用者提供作业的相应状态信息,而没有针对应用本身的运行状态进行监控和管理的问题,保证高性能计算集群上作业内的应用程序的正常运行,避免了资源的浪费,同时还保证了应用程序作业运行的准确性。