而AMD的x86 Open64编译器套件是一款高性能,生产质量的代码生成工具设计用于高性能并行计算的工作负载和NBSP;在86 Open64环境提供了开发建设和优化C,C ++,当Fortran应用程序的必要选择,针对32位和64位的Linux平台。
在x86编译器Open64系统提供了先进的优化,多线程和处理器支持,包括全局优化,矢量化,过程间分析,反馈的优化,循环变换和代码生成从每个x86处理器内核提取最佳性能较高水平。
在x86 Open64编译器套件简化并加快开发和调整用于x86,AMD64(AMD&章; x86-64架构),和Intel64位(英特尔® x86-64架构)的应用程序。在x86 Open64编译器创建通过MPI,OpenMP的&章,和自动并行化以及高度优化库*构建健壮,高性能并行代码打下坚实的基础
功能:
- <李类=“bbli”>语言标准:
- 在ANSI C99,ISO C ++ 98
- 符合ISO / IEC 9899:1999,编程语言 - C标准
- 符合ISO / IEC 14882:1998(E),编程语言 - C ++标准
- 的Fortran 77,90,95
- 符合ISO / IEC 1539-1:1997编程语言 - Fortran语言
- 在跨语言调用
- 在IEEE 754浮点支持
- 编译指示控制优化
- 在x86 32位和x86 64位代码生成
- 在大文件支持
- 字节交换I / O
- 矢量和标量SSE / SSE2 / SSE3代码生成
- 的OpenMP 2.5共享内存模型
- MPICH2分布式和共享内存模式
- 优化AMD核心数学库(ACML)
- 优化亮点
- 全局优化,例如。
- 在部分冗余消除
- 常量传送和代码移动
- 强度降低和简化的表达
- 在死代码消除和公共子表达式删除
- 循环巢优化,如: (与'-O3“启用)
- Loopfusion和分配
- 循环交换和缓存局部性优化
- 矢量上证所*代码生成
- 软件数据预取
- 代码生成和优化,例如。
- 高级寄存器分配
- 循环展开
- 指令选择和安排
- 窥孔优化
- 反馈指导的优化(与'-fb_create / -fb_opt'启用),如:
- 代码布局
- 在定向反馈功能,内联和去虚拟化
- 反馈制导寄存器溢出
- 价值专业化
- 的过程间分析和优化(与'-ipa'启用),如:
- 函数内联和克隆
- 的过程间别名分析
- 数据重新布局优化的结构成员
- 的过程间持续传播和死代码消除
<李班=“bbli”>平台亮点:
在32位系统
什么在此版本中是新的:
- 在该版本包括新的性能优化,为AMD家庭支持15小时,从源头更好的建筑,和许多错误修正。
什么4.2.4版本新:
- 在改进的内联函数启发式和加强内联扩展库功能
- 增强型框架多版本
- 改进诱导表达的简化,如果逐级优化
- 改进代码生成%运营商
- 改进间分析的间接函数调用,虚函数,并与&QUOT功能;不返回的&QUOT;属性。
- 优化的异常处理
- 优化的Fortran处理90临时数组
- 改进处理器关联映射和并行运行时库
- 添加了1GB的大内存页的支持
- 简体浮点选项
- 长双实现为80位IEEE双精度
- 内在加入-ffastmath
- 的Fortran ISO_C_BINDING模块
- 在许多领域Bug修复包括:
- 在GCC的兼容性
- 在巨大的页支持
- Fortran的支持
- 的OpenMP
- 从源大厦
- 在扩展的平台支持,包括RHEL 5.5和SLES11 SP1
在OpenMP的
什么4.2.4版本新:
- 在改进的内联函数启发式和加强内联扩展库功能
- 增强型框架多版本
- 改进诱导表达的简化,如果逐级优化
- 改进代码生成%运营商
- 改进间分析的间接函数调用,虚函数,并与&QUOT功能;不返回的&QUOT;属性。
- 优化的异常处理
- 优化的Fortran处理90临时数组
- 改进处理器关联映射和并行运行时库
- 添加了1GB的大内存页的支持
- 简体浮点选项
- 长双实现为80位IEEE双精度
- 内在加入-ffastmath
- 的Fortran ISO_C_BINDING模块
- 在许多领域Bug修复包括:
- 在GCC的兼容性
- 在巨大的页支持
- Fortran的支持
- 的OpenMP
- 从源大厦
- 在扩展的平台支持,包括RHEL 5.5和SLES11 SP1
在OpenMP的
什么4.2.3版本新:
- 在改进的过程间分析,包括结构数组复制和优化阵列重新映射优化。
- 改进的循环优化:循环展开,循环展开,果酱,三角环,主动循环交换,循环分布,循环剥离
- 改进了冗余消除优化的存储和内存初始化;更好地整合重关联和公共子表达式消除;表达增强分解。
- 改进指令选择和处理代码生成。
- 改进矢量。
- 扩展预取到包括与感性基址阵列。
- 在增强回路多版本。
- 改进的OpenMP和自动并行代码生成。
- 的OpenMP并行运行时库函数的改进调整。
- 在推出激进的优化,以提高多核心处理器的可扩展性/带宽利用率。 (通过指定新的&QUOT调用; -mso&QUOT;标志)
- 改进GCC的兼容性,包括更多的属性,命令行选项,并内置函数的支持。
- 在扩展平台支持,包括SLES 11和RHEL 5.4。
- 在许多bug修复。
评论没有发现