神鹰现在是由这样的计算环境的两个技术和社会学挑战的影响,
神鹰团队已建立惊人的工具,使科学家和工程师,以提高他们的计算吞吐量
什么在此版本中是新的:
- < LI> 7.6.X是新的稳定神鹰系列。
- 在许多新的特点进行自7.4.X补充说。
什么在7.3.2版本新:
- 在发行说明:
- 从condor_status与-grid选项输出的格式已更改为提供更多有用的信息。
- 在删除附加到condor_status -format输出的末尾换行符。因此,它解析这个命令的输出代码应该修剪的最后一行时,现在要小心。
- 在新功能:
- 在condor_fetchlog现在可以卖到condor_schedd守护进程的历史文件。而且,保存的condor_schedd守护进程的历史文件现在可以每天或每月旋转。
- 在该condor_ckpt_server会自动清理过时检查点文件。该控制此行为的配置变量描述如下。
- 在该condor_ckpt_server(无论是32位或64位)的可执行文件现在将正确地传达之间的32位和64位提交节点。如果通过一定的偶然性位宽的问题发生在检查点协议(例如,与文件大小),清晰的错误信息记录在检查点服务器日志。
- 在新condor_ssh_to_job工具允许运行作业的交互式调试。请参阅[*]的细节。 手册页
- 的condor_status命令现在基本上更快,尤其是与-format选项。
- 在电网的宇宙网型GT5已添加提交新的Globus GRAM5服务。当一个GRAM服务被识别为GT5,jobmanager节流和网格监视器不被使用。参见5.3.2节的详细信息。
- 在电网的宇宙网型霜添加了对提交gLite的CREAM就业服务。参见5.3.8节的详细信息。
- 当低文件描述符创建新的网络套接字,condor_schedd守护现在避免无限叠加起来的消息,它会定期发送给condor_negotiator和condor_startd。
- 在网格监控的性能和故障处理都得到了提高。
- 对于网格中的宇宙栅式nordugrid,现在使用Nordugrid ARC的LDAP服务器,这将大大提高性能,获得作业状态信息。此外,神鹰可以将这些作业运行时,现在说不清。
- 在新-valgrind选项condor_submit_dag原因condor_submit_dag代替condor_dagman二进制为可执行文件生成使用的valgrind上condor_dagman一个提交描述文件。
- 在condor_dagman现在懒洋洋地评估,并打开节点作业日志文件。相反解析所有提交的说明文件,并立即在启动时打开他们指定的日志文件,condor_dagman现在解析每个作业提交之前提交描述文件,并有每个日志文件打开,只有当相关作业队列中或执行后脚本。此外,condor_dagman现在会自动生成一个不指定一个任意节点作业默认的用户日志文件。
- 无论是对MPI宇宙的支持和文档已被删除。 MPI的应用程序通过使用平行宇宙的支持。
- 当虚拟机软件condor_startd守护进程的测试失败(配置为可运行的虚拟机的机器),该condor_startd将定期重试试验,直到成功为止。
- 的nordugrid_gahp现在限制到每个NorduGrid ARC服务器建立的连接的数量和重复使用的连接时可能的。
- 新增的ClassAd函数eval(),它接受一个字符串参数和评估字符串作为ClassAd表达的内容。一个政策的例子,这是非常有用的是在第3.5.9对工作暂停描述。
- 在新condor_q选项-attributes限制其使用-xml或-long选项时所显示的属性。限制的属性的数量也增加了查询的效率。
- 在秃鹰的电源管理功能,现在实现为一个插件。特别是,condor_startd现在运行一个外部程序,所指定的配置变量HIBERNATION_PLUGIN,以执行可用低功率状态的检测和切换到这些低功率状态。
- 在新的神鹰守护condor_rooster已添加唤醒冬眠机时的配置中定义的变量表达式变得UNHIBERNATE真。有关condor_rooster配置变量在第3.3.35中描述。
- 添加到提取用户事件日志读者态缓冲器到用户日志读取器信息的能力。这是通过一个新的ReadUserLogStateAccess C ++类中定义read_user_log.h实施。
- 更改组态变量CERTIFICATE_MAPFILE的值或文件的内容到它是指不再需要神鹰的完全重新开始。相反,命令condor_reconfig将导致使用的更改。
- 在该condor_master守护程序现在将打印的路径和参数启动,如果D_FULLDEBUG启用任何守护进程。此前,有没有办法得到它显示的参数与它起一个守护进程。
- 在该condor_had守护现在有控制守护进程比其他condor_negotiator的能力。这是通过HAD_CONTROLLEE宏来控制。
- 在神鹰现在认识到X.509代理VOMS扩展。在VOMS属性编码作业ClassAd属性X509UserProxySubject。
- 在该condor_startd现在可以清理滞留的虚拟机,下面神鹰或者其主机操作系统的崩溃。
- 在经过大跌,condor_gridmanager不再重新启动所有jobmanagers的GT2职位。这应该改善恢复时间。
- 在神鹰作品归类为通用在condor_collector守护进程的ClassAds更好。是自己注册的通用ClassAds各种后台程序现在可以有它使用-subsystem选项正确地处理自己的ClassAds工具。
- 在神鹰现在提供了一个机制来执行严格的资源限制了运行作业的一些宇宙。
- 在配置变量添加和更改:
- 在新的配置变量EMAIL_SIGNATURE指定自定义签名被附加到电子邮件的神鹰系统发送。如果定义,那么这个定制的签名取代内部指定的默认之一。有此变量没有默认值。
- 在新的配置变量CKPT_SERVER_CLIENT_TIMEOUT通知condor_schedd多久,它是在几秒钟内愿意等待,试图跟一个condor_ckpt_server过程声明condor_ckpt_server下来之前。见3.3.11的完整描述。
- 在新的配置变量CKPT_SERVER_CLIENT_TIMEOUT_RETRY通知,一旦condor_ckpt_server被标记为已下condor_schedd,怎么可能会秒必须通过前condor_schedd会尝试与condor_ckpt_server再次沟通。见3.3.11的完整描述。
- 在新的配置变量CKPT_SERVER_REMOVE_STALE_CKPT_INTERVAL通知开始清除陈旧的检查站,在以秒为单位指定的时间间隔的condor_ckpt_server。参见3.3.8节的完整描述。
- 在新的配置变量CKPT_SERVER_STALE_CKPT_AGE_CUTOFF通知condor_ckpt_server检查点文件的访问时间必须多大是为了被视为失效。这一次是比较反对的,现在当检查点服务器检查检查点映像文件的当前观点。参见3.3.8节的完整描述。
- 在新的配置变量SlotWeight可以用来计算时使用,计算公平共享,并强制执行组配额给插槽更大的权重。为完整的描述,请参阅3.3.10。
- 在新的配置变量MAX_PERIODIC_EXPR_INTERVAL实现周期性表现,评价之间的时间上限,由于自适应时序配置变量PERIODIC_EXPR_TIMESLICE暗示。为完整的描述,请参阅3.3.11。
- 新的配置变量GRIDMANAGER_SELECTION_EXPR可以用来控制多少condor_gridmanager进程将被衍生以管理网格宇宙作业。由于这种变化的一部分,去掉了配置变量,支持代码GRIDMANAGER_PER_JOB由于新配置变量取代它。为完整的描述,请参阅3.3.11。
- 在配置变量GRIDMANAGER_MAX_PENDING_SUBMITS_PER_RESOURCE和相应的油门GRIDMANAGER_MAX_PENDING_SUBMITS已被删除。
- 在新的配置变量GRID_MONITOR_DISABLE_TIME控制多久试图重新启动电网监控作业之前遇到错误后condor_gridmanager等待。为完整的描述,请参阅3.3.23。
- 在新的预定义的配置宏DETECTED_MEMORY表示物理内存(RAM)由神鹰检测量。该值以MB为单位。
- 在新的预定义的配置宏DETECTED_CORES指示由神鹰检测CPU内核的数量。
- 在新的配置变量DELEGATE_FULL_JOB_GSI_CREDENTIALS控制一个完整的或有限的X.509代理是否被委托电网类型GT2电网宇宙的工作。为完整的描述,请参阅3.3.26。
- 在新的配置变量UNHIBERNATE所使用的condor_startd在ClassAd做广告一个布尔表达式,指定当机器应该被唤醒,例如通过condor_rooster。为完整的描述,请参阅3.3.10。
- 新的配置变量HIBERNATION_PLUGIN指定的路径插件,其中condor_startd同时使用,以检测一台机器的低功率状态的能力,并到机器切换到低功率状态。为完整的描述,请参阅3.3.10。
- 在新的配置变量HIBERNATION_PLUGIN_ARGS指定额外的命令行参数其中condor_startd将传递给插件调用它的机切换到低功耗状态时。为完整的描述,请参阅3.3.10。
- 新的配置变量HIBERNATION_OVERRIDE_WOL可以用来指示condor_startd忽略唤醒设备的网络接口的LAN(WOL)功能,并且可切换到低功率状态,即使接口不支持WOL,或者如果WOL禁用就可以了。为完整的描述,请参阅3.3.10。
- 在新的配置变量DAGMAN_USER_LOG_SCAN_INTERVAL控制长condor_dagman检查作业日志文件的状态更新之间如何等待。为完整的描述,请参阅3.3.25。
- 在新的配置变量DAGMAN_DEFAULT_NODE_LOG设置新condor_dagman默认节点日志文件的功能默认的日志文件名。为完整的描述,请参阅3.3.25。
- 删除配置变量DAGMAN_DELETE_OLD_LOGS;新的日志文件读取代码,使得它已经过时了。
- 在新的配置变量HAD_CONTROLLEE用于指定该condor_had控制守护进程的名称。此名称应在condor_master的DAEMON_LIST匹配守护程序的名称。
- 在修复的错误:
- 修正了ClassAd功能的臭虫论据应该已经正确地强制转换为字符串,而不是计算误差。
- 修正了JobRouter,5分钟被提交内被删除的作业时,即发生混乱的诊断信息。
- 修正了在使用动态插槽(见第3.13.7)所引起的机器ClassAd属性SLOT_STARTD_ATTRS从ClassAd消失一段插槽。
- 修正了其中属于Condor任务窗口不接收绘制消息在Windows平台上的错误。
- 修正了一个导致condor_q - 分析当时没有condor_schedd守护ClassAd文件崩溃的bug。
- 修正了condor_procd崩溃引起的,当监视进程的环境超过1Mb的在/ proc。
- 修正了Windows平台上的错误,可能导致condor_credd崩溃,如果请求的证书不在密码存储区。
- 修正了任务事件日志旋转锁定为与不正确的权限创建一个bug。
- 在固定作业事件日志的旋转中的错误可能导致它从未在秃鹰的Windows移植旋转。
- 在固定作业的事件日志初始化一个潜在的竞争状态。
- 修正竞争状态,可能导致在关机condor_collector和condor_schedd崩溃。
- 修正了其中condor_master有时会死,并产生时,无论是由于重新启动新的二进制文件的时间戳或当最初开始dprintf_failure.MASTER文件中的错误。
- 在固定相关,当秃鹰重新配置发生SOAP配置变量内存泄漏。
- 修正了其提交描述文件命令cron_day_of_week被错误地忽略了一个错误。
- 修正了其中的配置变量MAX_JOB_QUEUE_LOG_ROTATIONS和GRIDMANAGER_SELECTION_EXPR不会在启动时正常工作的bug;他们只有一个condor_reconfig后的工作。
- 修正了其SOAP行动是被错误地授权与对端IP中的错误。
- 在修正中,并非所有神鹰守护是由Windows防火墙(以前称为Internet连接防火墙或ICF)信任的Windows平台上的错误。
- 修正了关机竞争条件在condor_master相对于高可用性守护进程。
- 修正了一个错误,其中神鹰守护程序错误决定,它已用完的套接字描述符。
- 修正了一个错误的condor_schedd会阻止的时间很长的时间,同时试图连接到一个检查点下来的服务器。现在condor_schedd会做一个阻塞以超时连接到检查站服务器为几秒钟的配置数量。如果连接失败,condor_schedd将把暂停连接到检查点服务器,直到配置暂停期间通行证。描述此行为的配置文件变量如上所述。
- 在改变了的支票,condor_dagman确实为运行相同的DAG其他condor_dagman情况下,如果发现在启动时锁定文件。现在,如果condor_dagman不能确定对方是否DAGMan是活的,再这样下去,而不是退出。
- 修正了鹳守护进程的一个主要文件描述符泄漏。
- 修正了其成功的鹳转移被标记为失败。错误
- 在固定阅读格式错误事件时,在用户事件日志文件读取代码,一种罕见的内存泄漏。
- 修正了在多机ClassAds与同名condor_collector,但不同的StartdIPAddr属性值,将导致condor_negotiator退出并提供一个错误。这是不寻常的,不应该发生在一个典型的神鹰安装。最可能的原因是使用condor_advertise为电网牵线搭桥做广告定制ClassAds。
- 修正了condor_dagman核心转储如果所有提交的尝试失败有一个POST脚本DAG节点上的错误。因为秃鹰版本7.1.4这个bug已经存在。
- 修正了condor_schedd,当配置变量NEGOTIATOR_MATCH_EXPRS使用发生内存泄漏。
- 修正了这把脚本作为可执行文件在Windows平台代码中的错误。未知的文件扩展名被视为错误,而不是作为Windows可执行文件。
- 的condor_job_router现在正确地设置创建一个新的路由作业时ClassAd属性EnteredCurrentStatus到当前时间。此前,它复制从原来的工作这个属性。
- 在该condor_job_router发出一个更友好的日志信息时,它指出,在拆卸作业的路由副本。
- 系统修复已为出现在7.3.1一个问题,即使用建行神鹰守护程序连接到其他神鹰守护进程有时会消耗没有很好的理由大量的CPU时间。
- 修正了它试图通过建行连接可以留在待定状态无限期一个罕见的失败案例的bug。
- 系统仅针对Unix错误导致秃鹰守护进程无法启动,如果MAX_FILE_DESCRIPTORS进行配置比继承神鹰当前硬限制高。如果神鹰以root权限运行,这已不再是这种情况。
- 在该condor_gridmanager现在做广告电网ClassAds适当的时候有多个condor_collector守护进程。
- 当使用condor_q -xml和-format在一起,以限制ClassAd的数目在查询属性返回,并没有生成的XML容器标签。这是固定的,但现在的首选方式来限制返回的属性是使用condor_q选项-attributes。
- 修正了一个在其中当试图重新启动本身,如果被定义配置变量MASTER_LOCK,或者如果condor_master与-t选项调用了Unix condor_master失败的bug。自7.0系列的这个bug已经存在,而且很可能已经存在比这更长的时间。
- 修正了gahp_server一个显著内存泄漏。此泄漏只出现在以前的神鹰7.3.x版本。
- 修正了可能会导致持有,然后释放返回空闲状态的去除工作中的错误。
- 在散发着X86-64 RHEL 5的RPM被损坏,造成GT4网格式作业失败的Globus的jar文件。这已得到修复。
什么在7.2.2版本新:
- 在增加神鹰的全端口的Debian 5.0 x86平台。
- 新增神鹰的修剪口的Debian 5.0 x86_64的平台。
- 新增的-DumpRescue命令行标志,以condor_dagman和condor_submit_dag。此标志的目的主要是用于测试。
- 在增加了对-debug选项condor_qedit支持。
- 作业路由器现在使用一个时间片定时器定期表达式计算,类似condor_schedd守护程序。评估间隔由配置变量PERIODIC_EXPR_INTERVAL控制,默认为60秒,使用的condor_schedd守护进程相同的默认值。
- 在作业路由器现在复位源工作,如果更新condor_schedd守护定期表达式计算为True时出现故障。作业的周期性表现,应过一段时间有一个成功的更新评估的未来。
什么在7.2.0版本新:
- 在主要功能增强
什么是7.0.5版本,新的:
- 在本新闻稿中包含了许多错误修正和改进了一些错误处理本地宇宙的作业。
- 请注意,一些错误修正是与安全有关的;因此,网站应该升级或限制在允许秃鹰作业提交到用户信赖谁的权限。
评论没有发现