2019年11月19日,丹佛訊——在2019國際超算大會(SC19)上,AMD公司不斷擴大其在高性能計算(HPC)領域的領先地位,并宣布其在全球頂級研究系統(tǒng)中贏得了一系列新客戶。AMD還宣布了支持AMD EPYC處理器和Radeon Instinct加速器的新平臺,并發(fā)布ROCm 3.0版本,為新的編譯器和HPC應用提供強勁支持。
AMD執(zhí)行副總裁、首席技術官Mark Papermaster表示:“AMD很榮幸作為Frontier的處理器供應商參加SC19。眾所周知,F(xiàn)rontier預期將在2021年交付時成為世界上性能最強的超級計算機。本周在SC19上,與會者可以體驗到與用于這一E級超算系統(tǒng)相同的AMD技術。無論是在高速互連中協(xié)同工作的高性能AMD EPYC CPU和Radeon Instinct GPU,還是AMD開放的軟件生態(tài)系統(tǒng),都將由超級計算領域的巨擘們帶來在SC19上亮相?!?/span>
在SC19,Mark Papermaster將與來自Cray、CERN和賽靈思的首席技術官們共同參加討論,探討在E級超算系統(tǒng)以及更多包括跨硬件、軟件和編程工具等新技術方面的創(chuàng)新突破。
新的Amazon EC2計算優(yōu)化實例將使用第二代AMD EPYC
亞馬遜云服務(AWS)擴大了對AMD EPYC處理器的采用,并宣布即將推出兩款新的Amazon Elastic Compute Cloud(Amazon EC2)計算優(yōu)化的實例C5a和C5ad。并且,這些實例將由運行頻率高達3.3Ghz的定制版第二代AMD EPYC處理器驅動。C5a和C5ad將提供8種虛擬化大小和最多96個vCPU,幫助客戶針對各種計算密集型工作負載(包括批處理,分布式分析和Web應用程序)在成本和性能上提供更多選擇。除此之外,為了讓客戶的應用程序能夠直接訪問基礎服務器的處理器和內存資源,兩種實例都將提供裸機版本。這些實例將在96個物理核心上擁有192個邏輯處理器,是目前EC2計算優(yōu)化實例家族中最大實例的兩倍。C5a和C5ad裸機實例能夠利用100 Gbps網(wǎng)絡帶寬,并與Elastic Fabric Adapter兼容,從而使客戶能夠擴展高性能計算和其他大型計算密集型的工作負載。新實例將在近期在多個AWS區(qū)域提供。
AMD將超級計算機推向新高度,EPYC進入TOP500強榜單
HPC組織們正在持續(xù)采用第二代AMD EPYC處理器和Radeon Instinct加速器來構建更多功能更強、效率更高的超級計算系統(tǒng)。Radeon Instinct GPU加速器可為HPC工作負載提供高達6.6 TFLOPS 的理論峰值雙精度運算性能。而且,第二代AMD EPYC處理器和Radeon Instinct加速器均支持PCIe 4.0,可實現(xiàn)高帶寬互連,從而在異構系統(tǒng)中實現(xiàn)更快的計算。
部署AMD處理器和加速器的最新客戶包括:
·數(shù)字轉換的全球領導者Atos正在向法國氣象局提供兩臺基于第二代EPYC的BullSequana XH2000超級計算機,用于大氣、海洋和氣候科學的動態(tài)天氣預報和研究。
·Atos和法國國家高性能計算組織GENCI宣布其Joliot-Curie超級計算機的最新擴展現(xiàn)在可供運作。該超級計算機基于Atos的BullSequana XH2000 解決方案和第二代EPYC處理器,并由CEA團隊在其TGCC(超大型計算中心)進行管理。
·Joliot-Curie超級計算機的擴展進入TOP500強第54位,成為全球排行榜中第一臺配備280W AMD EPYC 7H12 64核處理器的超級計算機。
·HPE所屬公司Cray近期宣布,推出兩臺配備第二代AMD EPYC處理器且基于Shasta?超級計算機架構的新型超級計算機ARCHER2和Vulcan。
·戴爾科技集團正在為圣地亞哥超級計算機中心及其Expanse超級計算機提供基于第二代AMD EPYC的Dell EMC PowerEdge服務器。
·蘇黎世聯(lián)邦理工學院在其Euler VI系統(tǒng)中使用了AMD EPYC 7742處理器。
·日本電氣有限股份公司(NEC)目前正在提供德國天氣預報服務,其使用的Deutscher Wetterdienst系統(tǒng)結合了第二代EPYC處理器和NEC SX-Aurora TSUBASA矢量引擎。
蘇黎世聯(lián)邦理工學院負責科學IT服務的Christian Bolliger表示: “我們之所以選擇AMD EPYC 7742處理器,是因為該處理器不僅能為研究人員日常使用的大多數(shù)軟件應用提供廣泛支持,并且還能提供令人印象深刻的原始性能、內存和I/O帶寬。更重要的是,它滿足了研究人員所需的性價比。憑借基于第二代AMD EPYC處理器的Euler VI系統(tǒng),研究人員可以獲得推進研究所需的諸多功能?!?/span>
AMD EPYC將超級計算帶入云時代
HPC領域正在不斷演進,以滿足新的工作負載和更高的性能要求。最重要的是,HPC需要更易于被長期或臨時使用。如今,這一切正在通過云來實現(xiàn)。與內部部署相比,云端部署能以較低的使用成本為用戶帶來同等水平的卓越性能。
早前,Microsoft Azure宣布使用在基于第一代AMD EPYC處理器的系統(tǒng)上運行的Azure HB云實例,獲得了此前無法企及的計算流體力學(CFD)性能水平。
如今,Azure針對高性能計算的Azure HBv2虛擬機已經(jīng)提供預覽,進一步突破了云端高性能計算的邊界。這些虛擬機全部基于AMD EPYC 7742處理器,為客戶帶來了超級計算機性能,支持200Gbps HDR InfiniBand和單項工作多達80,000個核心,通過云就可以輕松、便捷地訪問。
AMD推出ROCm 3.0版本
對“準E級超算”(pre-exascale)軟件生態(tài)系統(tǒng)的社區(qū)支持繼續(xù)擴大,該生態(tài)系統(tǒng)建立在由AMD提供的GPU計算基礎開源組件ROCm之上。ROCm以月為周期發(fā)布新功能,為開發(fā)人員提供固定的節(jié)奏來持續(xù)更新和改進編譯器、庫、分析器、調試器和系統(tǒng)管理等工具。在SC19上,AMD針對這一領域的主要宣布包括:
·發(fā)布支持HIP-clang的ROCm 3.0版本。HIP-clang是基于LLVM的編譯器,利用hipify-clang改進了CUDA轉換性能,并針對HPC和ML都進行了庫優(yōu)化。
·ROCm上游集成到了領先的TensorFlow和PyTorch機器學習框架中,用于強化學習、自動駕駛以及圖像和視頻檢測等應用。
·擴展了對HPC編程模型和應用程序的加速支持, 例如OpenMP編程、LAMMPS和NAMD。
·對系統(tǒng)和工作負載部署工具(如Kubernetes、Singularity、SLURM、TAU等)提供新的支持。
不斷擴張的硬件生態(tài)系統(tǒng)
由于HPC系統(tǒng)必須滿足愈發(fā)苛刻的工作負載,因此,由CPU和加速器驅動的異構計算對于現(xiàn)代HPC系統(tǒng)至關重要。AMD的合作伙伴正在建立能夠滿足異構計算需求的新平臺,以及傳統(tǒng)的僅用于計算的CPU:
·技嘉科技宣布推出四款新的支持第二代AMD EPYC處理器的G系列GPU服務器,即G292-Z22、G292-Z42、G482-Z50和G482-Z51。G482-Z51最多可支持8個PCIe 4.0 GPU卡,為客戶提供了出色的“AMD + AMD”選擇,可用于多種加速計算的工作負載。
·繼破紀錄的HPE ProLiant DL325 Gen10和DL385 Gen10服務器之后,新的Gen10 Plus型號現(xiàn)在也加入了該陣營。通過多達64顆處理器核心,3200 MT/s內存帶來的9%內存性能提高,支持PCIe 4.0實現(xiàn)的2倍I/O帶寬提升,以及與前代產(chǎn)品相比提升2.4倍的存儲容量,大大提高了虛擬化、HPC和大數(shù)據(jù)等重要工作負載的性能和效率。
·新的PenguinAltus?XE4218GT支持多達8個GPU,使Penguin客戶可以通過 “AMD + AMD”解決方案,使用第二代EPYC和Radeon Instinct MI50加速器支持的PCIe 4.0來推動機器學習、大數(shù)據(jù)分析和類似的工作負載。
·泰安(Tyan)還宣布了其以HPC為重點的Transport HX產(chǎn)品線和以數(shù)據(jù)庫為重點的Transport SX產(chǎn)品線的新平臺,這些平臺均由第二代AMD EPYC處理器提供支持。
隨著第二代AMD EPYC處理器和Radeon Instinct GPU加速器實現(xiàn)了對PCIe 4.0的支持,AMD與關鍵行業(yè)合作伙伴緊密攜手,充分引領了PCIe 4.0生態(tài)系統(tǒng)的建設。第二代EPYC全面支持PCIe 4.0設備,例如高速以太網(wǎng)和InfiniBand?互連、NIC和交換機、計算加速器(GPU和FPGA)和存儲(NVME SSD)設備。針對第二代AMD EPYC提供PCIe 4.0產(chǎn)品的合作伙伴包括:
·博通推出了支持200 GB以太網(wǎng)Thor NIC。
·Mellanox ConnectX-6 網(wǎng)卡展現(xiàn)了約400GB/s的InfiniBand性能。
·三星推出Gen4 PM1733 NVME SSD固態(tài)硬盤,展示出兩倍于其第3代 SSD的IOPS(每秒的輸入輸出量)。
·賽靈思Alveo U50、U280 FPGA。





