HPC挑战赛是一个高性能的基准测试套件。在HPC挑战基本上由7基准:
1. HPL - 在Linpack基准测试TPP衡量执行的浮点运算速度为求解线性方程系统。
2. DGEMM - 衡量执行双精度实矩阵,矩阵乘法的浮点速度。
3. STREAM - 测量持续的内存带宽(GB / s)的简单的合成基准测试程序和相应的计算速率的简单的矢量内核。
4. PTRANS(平行矩阵转置) - 练习与对方同时对在哪里处理器通信的通信。它是该网络的总通信容量的一个有用的测试。
5. RandomAccess的 - 措施整数随机更新的内存(GUPS)的速度。
6. FFTE - 测量执行双精度复杂一维离散傅立叶变换(DFT)的浮点速率。
7.通信带宽和延迟 - 一组测试来衡量延迟和一些同时通信模式的带宽;基于b_eff(有效带宽基准)。
编译:
第一步是创建一个反映你的机器特性的配置文件。该配置文件应在HPL目录中创建。该目录包含的指令(该文件README和INSTALL)如何创建配置文件。目录HPL /设置包含的配置文件的例子很多。一个好的方法是复制其中的一到HPL目录,如果它不工作,然后改变它。这个文件由HPC Challange套件的所有组件重复使用。
当配置完成后,文件应该存在于HPL目录的名称以制作。并与用于测试的系统的名称结束。例如,如果系统的名称是Unix的,该文件应被命名Make.Unix。
要构建基准可执行文件(名为Unix的系统)类型:让ARCH =的Unix。该命令应在顶级目录(而不是在HPL目录)下运行。它看起来在为配置文件的HPL目录,并用它来建立基准可执行文件。
配置:
在HPC Challange是由名为hpccinf.txt短输入文件,它是几乎相同用于HPL输入文件(习惯上称为HPL.dat)驱动。请参阅文件HPL / WWW / tuning.html有关HPL输入文件的详细信息。示例输入文件包含在HPC Challange分布。
HPL输入文件和HPC Challange输入文件之间的差异可以归纳如下:
* 3和4行被忽略。输出总是转到名为hpccoutf.txt文件。
*有附加行(从第33行),其可以(但不必)被用于定制在HPC挑战基准。下面对它们进行说明。
在HPC挑战输入文件(相对于HPL输入文件)的附加行是:
线33和34描述了其他的矩阵规模要用于运行PTRANS基准(在HPC Challange基准的组件之一)。
*线条35和36描述的附加阻塞因子将被用于运行PTRANS基准。
只是为了保持完整性,这里是他们的意思简短说明HPC Challange的输入文件的行列表:
*第1行:被忽略
*行2:忽视
* 3号线:忽略
* 4号线:忽略
* 5号线:矩阵大小为HPL(和PTRANS)数量
* 6号线:矩阵大小为HPL(和PTRANS)
* 7号线:阻断因素HPL(和PTRANS)数量
* 8号线:堵因素HPL(和PTRANS)
* 9号线:过程的顺序HPL类型
*第10行:工艺改造为HPL(和PTRANS)数量
*行11:行过程中每道工序电网HPL的数字(和
PTRANS)
*行12:每个进程网格HPL工艺列数
(和PTRANS)
*第13行:阈值不被缩放为残留超标
HPL(和PTRANS)
*第14行:面板分解方法HPL数量
*第15行:面板分解方法HPL
*第16行:递归停止准则HPL数量
*第17行:递归停止标准HPL
*第18行:递归面板数量为计数HPL
*第19行:递归面板算个HPL
*第20行:递归面板分解方法HPL数量
*行21:递归面板分解方法HPL
*行22:广播方式为HPL数量
*行23:广播方式为HPL
*第24行:前瞻深处HPL数
*行25:前瞻深处HPL
*第26行:交换方法HPL
*第27行:交换门槛HPL
* 28行:L1的HPL形式
*第29行:U的HPL形式
*第30行:值,指定平衡是否应使用
通过HPL
*第31行:为HPL内存对齐
*第32行:忽略
*第33行:额外的问题数量的大小PTRANS
*行34:另一个问题大小为PTRANS
* 35线:额外的阻塞因素PTRANS数量
*行36:额外的阻塞因素PTRANS
什么是此版本的新:
- 在该版本新增了优化RandomAccess的变种使用线性同余发生器产生随机数。
- 在全球削减加入误差计算在MPI FFT以获得更准确的错误估计。
- 基准的顺序被重新排列,以使HPL组件最后运行,并且可以被中止,如果其它组分的性能不能令人满意。
- 在了RandomAccess现在是第一,以协助调整的代码。
- 什锦错误是固定的。
评论没有发现