華為首次發(fā)布計算戰(zhàn)略:全球最快AI訓(xùn)練集群面世
9月18日,在第四屆HUAWEI CONNECT 2019(華為全聯(lián)接大會),在本次大會上,中國工程院院士、鵬城實(shí)驗(yàn)室主任高文院士,分享了鵬城實(shí)驗(yàn)室與華為的合作,力求共同打造中國首個動態(tài)進(jìn)化的E級AI超算系統(tǒng),構(gòu)建新一代人工智能基礎(chǔ)研究創(chuàng)新平臺。華為云業(yè)務(wù)總裁鄭葉來,則從商業(yè)應(yīng)用的角度,基于華為云在10多個行業(yè)、500多個項(xiàng)目的實(shí)踐,指出行業(yè)AI正在跨越商用裂谷,成為重塑企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵驅(qū)動。
華為首次發(fā)布計算戰(zhàn)略,基于架構(gòu)創(chuàng)新、投資全場景處理器族、有所為有所不為的商業(yè)策略、構(gòu)建開放生態(tài)進(jìn)行布局。同時,華為重磅發(fā)布了全球最快AI訓(xùn)練集群Atlas 900,加速科學(xué)研究與商業(yè)創(chuàng)新的智能化進(jìn)程。
華為首次發(fā)布計算戰(zhàn)略
華為副董事長胡厚崑表示,“我們面臨的是一個2萬億美元的計算產(chǎn)業(yè)大藍(lán)海,華為堅定不移地投入計算產(chǎn)業(yè),通過對架構(gòu)創(chuàng)新的突破、對全場景處理器的投資、堅持有所為有所不為的商業(yè)策略,以及構(gòu)建開放生態(tài)來布局戰(zhàn)略。”
第一,架構(gòu)創(chuàng)新。投資基礎(chǔ)研究,推出達(dá)芬奇架構(gòu),用創(chuàng)新的處理器架構(gòu)來匹配算力的增速。
第二,投資全場景處理器族,包括面向通用計算的鯤鵬系列,面向AI計算的昇騰系列,面向智能終端的麒麟系列,以及面向智慧屏的鴻鵠系列等。
第三,有所為有所不為的商業(yè)策略。華為不直接對外銷售處理器,以云服務(wù)面向客戶,以部件為主面向合作伙伴,優(yōu)先支持合作伙伴發(fā)展整機(jī)。
第四,構(gòu)建開放生態(tài)。未來5年,繼續(xù)投入15億美元,匯聚500萬開發(fā)者,使能全球合作伙伴開發(fā)應(yīng)用及解決方案。
Atlas 900創(chuàng)造全新世界紀(jì)錄
這款產(chǎn)品匯聚了華為十多年的技術(shù)沉淀,在衡量AI計算能力的金標(biāo)準(zhǔn)ResNet-50圖片分類模型下,Atlas 900只需59.8秒就完成了訓(xùn)練,在同等精度下比原來的世界紀(jì)錄快10秒。 “ ImageNet-1k數(shù)據(jù)集”包含128萬張圖片,精度為75.9%,在同等精度下,其他兩家業(yè)界主流廠家測試成績分別是70.2s和76.8s,Atlas 900 AI訓(xùn)練集群比第2名快15%。
據(jù)了解,Atlas 900 AI集群主要為大型數(shù)據(jù)集神經(jīng)網(wǎng)絡(luò)訓(xùn)練提供超強(qiáng)算力,可廣泛應(yīng)用于科學(xué)研究與商業(yè)創(chuàng)新,讓研究人員更快地進(jìn)行圖像、視頻和語音等AI模型訓(xùn)練,讓人類更高效地探索宇宙奧秘、預(yù)測天氣、勘探石油和加速自動駕駛的商用進(jìn)程。
Atlas 900 AI集群也可以提供云服務(wù),以云的方式提供充裕的、經(jīng)濟(jì)的算力資源,簡單易用、高效率、全流程的AI平臺,為客戶帶來極致體驗(yàn)的“易獲取、用得起、方便用”的普惠AI算力。為了讓各行各業(yè)獲取超強(qiáng)算力,華為將Atlas 900部署到云上,推出華為云EI集群服務(wù),并以極優(yōu)惠的價格,面向全球科研機(jī)構(gòu)和大學(xué),即刻開放申請使用。
“這是計算產(chǎn)業(yè)新的大航海時代,我們期待的是千帆競發(fā),而不是獨(dú)舟奮進(jìn)。我們期望和各行各業(yè)的伙伴共同努力,抓住歷史機(jī)遇,共創(chuàng)智能新高度。” 胡厚崑最后強(qiáng)調(diào)。
Atlas 900 代表當(dāng)今全球
算力巔峰
此次發(fā)布的Atlas 900 AI訓(xùn)練集群由數(shù)千顆昇騰910 AI處理器互聯(lián)構(gòu)成,是當(dāng)前全球最快的AI訓(xùn)練集群,代表了當(dāng)今全球的算力巔峰。其總算力達(dá)到256P~1024P FLOPS @FP16,相當(dāng)于50萬臺PC的計算能力。
除了昇騰910帶來的高性能外,Atlas 900還有四大亮點(diǎn)。
其一是AI算力業(yè)界領(lǐng)先。Atlas 900 AI訓(xùn)練集群采用業(yè)界單芯片算力最強(qiáng)的昇騰910 AI處理器,每顆昇騰910 AI處理器內(nèi)置32個達(dá)芬奇AI Core,單芯片提供比業(yè)界高一倍的算力。
其二是最佳集群網(wǎng)絡(luò)。Atlas 900 AI訓(xùn)練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯(lián)方式,百TB全互聯(lián)無阻塞專屬參數(shù)同步網(wǎng)絡(luò),降低網(wǎng)絡(luò)時延,梯度同步時延縮短10~70%。獨(dú)創(chuàng)iLossless 智能無損交換算法,對集群內(nèi)的網(wǎng)絡(luò)流量進(jìn)行實(shí)時的學(xué)習(xí)訓(xùn)練,實(shí)現(xiàn)網(wǎng)絡(luò)0丟包與E2E μs級時延。
其三是系統(tǒng)級調(diào)優(yōu)。Atlas 900 AI訓(xùn)練集群通過華為集合通信庫和作業(yè)調(diào)度平臺,整合HCCS、 PCIe 4.0 和100G RoCE三種高速接口,充分釋放昇騰910 AI處理器的強(qiáng)大性能。華為集合通信庫提供訓(xùn)練網(wǎng)絡(luò)所需的分布式并行庫,通信庫+網(wǎng)絡(luò)拓?fù)?訓(xùn)練算法進(jìn)行系統(tǒng)級調(diào)優(yōu),實(shí)現(xiàn)集群線性度>80%,極大提升了作業(yè)調(diào)度效率。
其四是極致散熱系統(tǒng)。傳統(tǒng)數(shù)據(jù)中心多以風(fēng)冷技術(shù)對設(shè)備進(jìn)行散熱,但在人工智能時代傳統(tǒng)數(shù)據(jù)中心卻面臨非常大的挑戰(zhàn)。Atlas 900 AI訓(xùn)練集群采用全液冷方案,創(chuàng)新性設(shè)計業(yè)界最強(qiáng)柜級密閉絕熱技術(shù),支撐>95%液冷占比。單機(jī)柜支持高達(dá)50kW超高散熱功耗,實(shí)現(xiàn)PUE<1.1的極致數(shù)據(jù)中心能源效率。極致的液冷散熱技術(shù)滿足了高功率、高密設(shè)備部署、低PUE的需求,極大地降低了客戶的TCO。
計算是人類認(rèn)知世界的一種模式。從大型機(jī)到個人計算機(jī),從智能手機(jī)到可穿戴設(shè)備,計算能力日益成為人類能力的延伸。同時,計算模式也在不斷演進(jìn),基于統(tǒng)計的計算模式將逐漸成為主流。預(yù)計5年后,AI計算所消耗的算力,將占到算力消耗總量的80%以上,計算正在進(jìn)入一個新的智能時代。





