目標:人工智能、云計算與高性能計算,amd推出全球首款7nm數據中心gp
2018-11-07 16:44來源:零鏡網//
原標題:目標:人工智能、云計算與高性能計算,amd推出全球首款7nm數據中心gp
在amd“跑步進入7nm時代”的行動中,gpu扮演了開路先鋒的角色。在今天召開的next horizon技術大會上,amd就宣布了全球首款7nm制程gpu產品:主要用于人工智能、云計算和高性能計算的amd radeon instinct mi60和mi50數據中心gpu。mi是machine intelligence的縮寫,可以很清晰地反映amd radeon instinct產品線的定位。
在看到競爭對手憑借專業計算卡在人工智能和高性能計算領域混得風生水起后,amd在一年多前正式推出了radeon instinct系列,用以取代之前的firepro s。而在今年,radeon instinct隨著7nm制程的升級也進行了產品升級,從之前的mi25升級為mi60和mi50。
我們先來看看amd radeon instinct mi60和mi50的具體指標。從現場展示的ppt來看,mi60和mi50的規格差距并不大,二者的計算單元數量分別為64個和60個,流處理器數量分別為4096個和3840個。
mi60和mi50依然是基于vega gpu架構,但是amd在采用7nm制程工藝的同時,對其核心架構進行了部分優化升級。比如優化了alu算術邏輯單元,也增加了ecc完全校驗功能,采用pcie 4.0接口標準等。
其核心規模從14nm vega 10的125億晶體管增加至7nm vega核心的132億晶體管,不過因為其制程工藝的提升,核心面積從484平方毫米降低到了331平方毫米。同時其核心尺寸僅相當于競爭對手的大約40%,因此mi60和mi50在部署成本和密度方面具備相當的優勢。
相比之前的mi25,mi60將內存帶寬提高到了夸張的1tb/s,集合32gb hbm2存儲,其數據單款基本達到了頂峰。同時,其還實現了包括gpu和存儲在內的全面ecc校驗,以及pcie 4.0接口。
架構的優化、制程的提升以及存儲帶寬的擴大,使得mi60可以提供強大的混合精度fp16、fp32和int4/int8能力,從而滿足動態工作負載的需求,特別是從訓練復雜神經網絡到運行針對這些訓練網絡的推理。同時,mi60還是目前世界上最快的雙精度pcie 4.0加速器,提供了高達7.4tflops的峰值fp64性能,能夠更有效地處理包括生命科學、能源、金融、汽車、航空航天、學術、政府、國防等行業的高性能應用。
相比mi25,mi60的fp16浮點性能提高了20%,int8、int4整數性能分別提高了140%、380%。憑借在int8和fp64方面的性能改進,amd得以將其radeon instinct產品線的應用場景從mi25時代的神經網絡訓練和虛擬化,擴展到了推理計算和高性能計算領域。
另外,通過pcie 4.0接口和infinity fabric link gpu互連技術,amd可以通過硬件橋接的方式,實現八張加速卡分成兩組的彼此互聯。通過橋接,mi60可以實現高達6倍的快速數據傳送,每個gpu的兩個infinity fabric鏈路擁有多達200gb/s的對等帶寬。
而在8張加速卡可以基于硬件虛擬化實現靈活組合,從一張加速卡支持16個虛擬機,到一臺虛擬機擁有8張加速卡。
同時,其組合方式也非常靈活。1臺服務器內擁有的8張加速卡可以采用靈活分組的方式,配置成為擁有1張、2張、4張以及8張加速卡的虛擬機。
來源:搜狐
以上是網絡信息轉載,信息真實性自行斟酌。