您現(xiàn)在的位置:海峽網(wǎng)>新聞中心>IT科技>科技前沿
分享

華為AI訓(xùn)練集群是什么? 華為AI訓(xùn)練集群Atlas900有多快?

網(wǎng)易科技訊 9月18日消息,華為全聯(lián)接2019大會上,華為副董事長胡厚崑發(fā)布了Atlas 900 AI訓(xùn)練集群。此次發(fā)布的Atlas 900 AI訓(xùn)練集群由數(shù)千顆昇騰910 AI處理器互聯(lián)構(gòu)成,是當(dāng)前全球最快的AI訓(xùn)練集群,代表了當(dāng)今全球的算力巔峰。其總算力達(dá)到256P~1024P FLOPS @FP16,相當(dāng)于50萬臺PC的計(jì)算能力。

AI算力領(lǐng)先

Atlas 900 AI訓(xùn)練集群采用業(yè)界單芯片算力最強(qiáng)的昇騰910 AI處理器,每顆昇騰910 AI處理器內(nèi)置32個達(dá)芬奇AI Core,單芯片提供比業(yè)界高一倍的算力。Atlas 900 AI訓(xùn)練集群將數(shù)千顆昇騰910 AI處理器互聯(lián),打造業(yè)界第一的算力集群。

昇騰910 AI處理器采用SoC設(shè)計(jì),集成“AI算力、通用算力、高速大帶寬I/O”,大幅度卸載Host CPU的數(shù)據(jù)預(yù)處理任務(wù),充分提升訓(xùn)練效率。

最佳集群網(wǎng)絡(luò)

Atlas 900 AI訓(xùn)練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯(lián)方式,百TB全互聯(lián)無阻塞專屬參數(shù)同步網(wǎng)絡(luò),降低網(wǎng)絡(luò)時(shí)延,梯度同步時(shí)延縮短10~70%。

在AI服務(wù)器內(nèi)部,昇騰910 AI處理器之間通過HCCS高速總線互聯(lián);昇騰910 AI處理器和CPU之間以最新的PCIe 4.0(速率16Gb/s)技術(shù)互聯(lián),其速率是業(yè)界主流采用的PCIe 3.0(8.0Gb/s)技術(shù)的兩倍,使得數(shù)據(jù)傳輸更加快速和高效。在集群層面,采用面向數(shù)據(jù)中心的CloudEngine 8800系列交換機(jī),提供單端口100Gbps的交換速率,將集群內(nèi)的所有AI服務(wù)器接入高速交換網(wǎng)絡(luò)。

獨(dú)創(chuàng)iLossless 智能無損交換算法,對集群內(nèi)的網(wǎng)絡(luò)流量進(jìn)行實(shí)時(shí)的學(xué)習(xí)訓(xùn)練,實(shí)現(xiàn)網(wǎng)絡(luò)0丟包與E2E μs級時(shí)延。

系統(tǒng)級調(diào)優(yōu)

Atlas 900 AI訓(xùn)練集群通過華為集合通信庫和作業(yè)調(diào)度平臺,整合HCCS、 PCIe 4.0和100G RoCE三種高速接口,充分釋放昇騰910 AI處理器的強(qiáng)大性能。

華為集合通信庫提供訓(xùn)練網(wǎng)絡(luò)所需的分布式并行庫,通信庫+網(wǎng)絡(luò)拓?fù)?訓(xùn)練算法進(jìn)行系統(tǒng)級調(diào)優(yōu),實(shí)現(xiàn)集群線性度>80%,極大提升了作業(yè)調(diào)度效率。

散熱系統(tǒng)

傳統(tǒng)數(shù)據(jù)中心多以風(fēng)冷技術(shù)對設(shè)備進(jìn)行散熱,但在人工智能時(shí)代傳統(tǒng)數(shù)據(jù)中心卻面臨非常大的挑戰(zhàn)。高功耗器件比如CPU和AI芯片帶來更大的熱島效應(yīng)要求更高效的冷卻方式。液冷技術(shù)可以滿足數(shù)據(jù)中心高功率、高密部署、低PUE的超高需求。

Atlas 900 AI訓(xùn)練集群采用全液冷方案,創(chuàng)新性設(shè)計(jì)業(yè)界最強(qiáng)柜級密閉絕熱技術(shù),支撐>95%液冷占比。單機(jī)柜支持高達(dá)50kW超高散熱功耗,實(shí)現(xiàn)PUE<1.1的極致數(shù)據(jù)中心能源效率。

另外,在空間節(jié)省方面,與8kW風(fēng)冷機(jī)柜相比,節(jié)省機(jī)房空間79%。極致的液冷散熱技術(shù)滿足了高功率、高密設(shè)備部署、低PUE的需求,極大地降低了客戶的TCO。

據(jù)了解,華為已在華為云上部署了一個Atlas 900 AI訓(xùn)練集群,集群規(guī)模為1024顆昇騰910 AI處理器?;诋?dāng)前最典型的“ResNet-50 v1.5模型”和“ImageNet-1k數(shù)據(jù)集”,Atlas 900AI訓(xùn)練集群只需59.8秒就可完成訓(xùn)練,排名全球第一。

“ImageNet-1k數(shù)據(jù)集”包含128萬張圖片,精度為75.9%,在同等精度下,其他兩家業(yè)界主流廠家測試成績分別是70.2s和76.8s,Atlas 900 AI訓(xùn)練集群比第2名快15%。

Atlas 900 AI集群主要為大型數(shù)據(jù)集神經(jīng)網(wǎng)絡(luò)訓(xùn)練提供超強(qiáng)算力,可廣泛應(yīng)用于科學(xué)研究與商業(yè)創(chuàng)新,讓研究人員更快地進(jìn)行圖像、視頻和語音等AI模型訓(xùn)練,讓人類更高效地探索宇宙奧秘、預(yù)測天氣、勘探石油和加速自動駕駛的商用進(jìn)程。

責(zé)任編輯:楊林宇

       特別聲明:本網(wǎng)登載內(nèi)容出于更直觀傳遞信息之目的。該內(nèi)容版權(quán)歸原作者所有,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。如該內(nèi)容涉及任何第三方合法權(quán)利,請及時(shí)與ts@hxnews.com聯(lián)系或者請點(diǎn)擊右側(cè)投訴按鈕,我們會及時(shí)反饋并處理完畢。

相關(guān)閱讀
關(guān)鍵詞: 華為AI訓(xùn)練集群
最新科技前沿 頻道推薦
進(jìn)入新聞頻道新聞推薦
普通高校招生體育類專業(yè)省級統(tǒng)一考試18
進(jìn)入圖片頻道最新圖文
進(jìn)入視頻頻道最新視頻
一周熱點(diǎn)新聞
下載海湃客戶端
關(guān)注海峽網(wǎng)微信
?

職業(yè)道德監(jiān)督、違法和不良信息舉報(bào)電話:0591-87095414 舉報(bào)郵箱:service@hxnews.com

本站游戲頻道作品版權(quán)歸作者所有,如果侵犯了您的版權(quán),請聯(lián)系我們,本站將在3個工作日內(nèi)刪除。

溫馨提示:抵制不良游戲,拒絕盜版游戲,注意自我保護(hù),謹(jǐn)防受騙上當(dāng),適度游戲益腦,沉迷游戲傷身,合理安排時(shí)間,享受健康生活。

CopyRight ?2016 海峽網(wǎng)(福建日報(bào)主管主辦) 版權(quán)所有 閩ICP備15008128號-2 閩互聯(lián)網(wǎng)新聞信息服務(wù)備案編號:20070802號

福建日報(bào)報(bào)業(yè)集團(tuán)擁有海峽都市報(bào)(海峽網(wǎng))采編人員所創(chuàng)作作品之版權(quán),未經(jīng)報(bào)業(yè)集團(tuán)書面授權(quán),不得轉(zhuǎn)載、摘編或以其他方式使用和傳播。

版權(quán)說明| 海峽網(wǎng)全媒體廣告價(jià)| 聯(lián)系我們| 法律顧問| 舉報(bào)投訴| 海峽網(wǎng)跟帖評論自律管理承諾書

友情鏈接:新聞頻道?| 福建頻道?| 新聞聚合