2019年尾聲,國際芯片巨頭英偉達、英特爾、AMD等在高性能計算(HPC)上新動作連連,升級市場競爭,在本周舉辦2019國際超級計算大會(SC19)上,芯片巨頭們便展開了正面交鋒。
巨頭們認為,隨著人工智能時代的到來和數據科學的爆發,HPC市場的增長趨勢將不容忽視,必先占領高地。
(來源:英偉達)
英偉達宣布幾項重要動作,以推進HPC上的布局:包括發布一款參考設計平臺,將CUDA加速帶入到Arm架構當中,幫助企業能夠快速構建GPU加速的Arm服務器;和微軟合作構建搭載在Microsoft Azure云上的新型GPU加速超級計算機,將超快的計算能力帶到了Azure系統;推出軟件套件Magnum IO,專為解決存儲和輸入/輸出(I/O)遇到瓶頸這一問題進行了優化,可以更好地幫助數據科學家和AI研究人員解決數據瓶頸問題。
據介紹,此次發布的全新NDv2實例是Azure上規模最大的一次部署,該產品專為處理要求苛刻的AI和高性能計算應用而設計,是全球速度最快的超級計算機之一,可在一個Mellanox InfiniBand后端網絡上提供多達800個互聯的NVIDIA V100 Tensor Core GPU。
另外,對于用戶來說,他們將可以在自己的桌面中租用整臺AI超級計算機,其性能與那些需要數月時間才能完成部署的大型本地超級計算機相匹配。
英偉達副總裁兼加速計算總經理Ian Buck表示:“這款在Microsoft Azure上推出的新產品實現了AI的大眾化,使更多人能夠獲得基礎工具,來解決一些全球最大的挑戰。”
(來源:英偉達)
而英偉達CEO黃仁勛稱:“高性能計算正在崛起。機器學習和AI領域的突破正在重新定義科學研究方法,并且可能帶來激動人心的新架構。從超大規模云到百萬兆級超級計算,英偉達GPU與ARM的組合讓創新者們能夠為不斷增加的新應用創建系統。”
同樣在SC19的場合上,英特爾也高調宣布其推出的首款為高性能計算設計的GPU。英特爾推出的“Ponte Vecchio”,是一款專為高性能計算建模、模擬工作任務和人工智能訓練而設計的GPU,將基于英特爾新一代7納米工藝進行制造。
(來源:英特爾)
與英偉達的CUDA接口類似,英特爾還推出了面向開發者的onEAPI編程接口,以幫助開發者實現跨不同計算體系結構的軟件開發。
Ponte Vecchio有望整合到美國能源部(DOE)計劃于2021交付的下一代百億億次超級計算機Aurora中。據稱Aurora配備了兩個Intel Xeon Sapphire Rapids處理器和六個Intel Xe Ponte Vecchio圖形卡。
今年以來,AMD在高性能計算領域也吸引了一些新客戶,包括將負責打造世界最強超級計算機之一Frontier(同樣于2021年交付),以及亞馬遜AWS正在擴大AMD Epyc處理器使用規模。在SC19上,AMD同樣宣布將超算能力帶到云上,將推出兩個新的Amazon Elastic Compute Cloud(Amazon EC2)計算優化實例。
如今,GPU在這些大型計算機中越來越重要,正在成為完成大型計算任務的必需品。近日發布的最新一期全球超級計算機榜單top 500也顯示,有越來越多的超級計算機系統都配備了圖形處理加速芯片。
最新一期TOP 500榜單,美國超算的整體性能仍是第一,中國在數量上的領先優勢進一步擴大
目前,全球排在前4位的超算為:橡樹嶺國家實驗室的IBM超算Summit運算速度148.6 petaflops;勞倫斯利物莫國家實驗室的IBM超算Sierra運算速度94.6 petaflops,中國的神威太湖之光第三運算速度93 petaflops;天河二號A以61.4 petaflops排名第四。
Wells Fargo分析師在一份報告中寫道:“隨著核心增速的放緩,2019年11月的排行榜再次凸顯了GPU在保持計算機性能增長方面日益重要的作用,行業可以通過增加加速器的使用來保持計算機性能提升,目前加速器占所有部署核心的27%,而2018年11月這一比例為24%。”