[No.X006-3]
12月2日,在加拿大舉行的第32屆NIPS神經(jīng)信息處理系統(tǒng)大會(huì)上,百度正式發(fā)布自主研發(fā)的超級AI計(jì)算平臺(tái)X-MAN3.0。該平臺(tái)專為AI深度學(xué)習(xí)場景優(yōu)化設(shè)計(jì),每秒完成2000萬億次深度神經(jīng)網(wǎng)絡(luò)計(jì)算,極大的加快了AI深度學(xué)習(xí)模型的訓(xùn)練速度。
NIPS作為機(jī)器學(xué)習(xí)和神經(jīng)計(jì)算領(lǐng)域的頂級會(huì)議,吸引了機(jī)器學(xué)習(xí)、人工智能、統(tǒng)計(jì)等領(lǐng)域的眾多國際專家參與。近年來,在計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理等領(lǐng)域也出現(xiàn)了大量的創(chuàng)新應(yīng)用,NIPS在AI深度學(xué)習(xí)領(lǐng)域的學(xué)術(shù)影響力變得舉足輕重。
算法、數(shù)據(jù)和計(jì)算是推動(dòng)AI深度學(xué)習(xí)技術(shù)快速發(fā)展的三大要素。為支持更強(qiáng)的泛化能力,更高的預(yù)測精度,算法模型日趨復(fù)雜,越來越多的數(shù)據(jù)需要被及時(shí)標(biāo)注和處理,計(jì)算性能成為關(guān)鍵。百度X-MAN超級AI計(jì)算平臺(tái)提供極致的計(jì)算性能,支持超大復(fù)雜算法模型,能夠快速及時(shí)處理海量數(shù)據(jù)。自2016年誕生以來,百度X-MAN超級AI計(jì)算平臺(tái)歷經(jīng)3代發(fā)展,3次架構(gòu)升級,創(chuàng)造6項(xiàng)業(yè)界第一,同時(shí)期關(guān)鍵技術(shù)&性能保持領(lǐng)先,引領(lǐng)行業(yè)發(fā)展趨勢。目前,X-MAN系列產(chǎn)品已在百度大規(guī)模應(yīng)用,正在助力百度AI戰(zhàn)略快速落地。
X-MAN解決的3大關(guān)鍵技術(shù)挑戰(zhàn)
為提供更強(qiáng)的計(jì)算性能和最佳的計(jì)算效率,X-MAN在系統(tǒng)設(shè)計(jì)中面臨了三大關(guān)鍵技術(shù)的挑戰(zhàn):如何有效提升單機(jī)計(jì)算性能、如何實(shí)現(xiàn)多機(jī)加速的高可擴(kuò)展性以及如何均衡CPU與AI加速芯片的配比關(guān)系,以避免系統(tǒng)瓶頸。
在有限的單機(jī)空間內(nèi),集成更多數(shù)量、性能更強(qiáng)、互聯(lián)帶寬更高的AI加速卡,是提升單機(jī)計(jì)算性能的直接手段,但帶來了高速互聯(lián)、結(jié)構(gòu)、散熱、供電等硬件技術(shù)難題;單機(jī)訓(xùn)練方式難以滿足超大規(guī)模數(shù)據(jù)集和復(fù)雜的模型場景下的計(jì)算力需求,大規(guī)模分布式訓(xùn)練成為必然,解決多機(jī)加速的可擴(kuò)展性就成了關(guān)鍵技術(shù)難題;深度學(xué)習(xí)模型的負(fù)載差異較大,CPU密集型,計(jì)算密集型,通信密集型,存在著多種需求場景,為了避免系統(tǒng)性能瓶頸、充分發(fā)揮計(jì)算效率,如何快速靈活的調(diào)整CPU和AI計(jì)算芯片的配比并支持獨(dú)立迭代升級成了關(guān)鍵的技術(shù)難題。
X-MAN的3次架構(gòu)升級和9大技術(shù)特征
自2016年首次發(fā)布以來,X-MAN的三代產(chǎn)品各自都有著鮮明的設(shè)計(jì)理念:超高的計(jì)算密度、高效散熱、兼容多元化AI加速芯片。X-MAN通過3次架構(gòu)升級,有效攻克了3大技術(shù)挑戰(zhàn)。
X-MAN1.0發(fā)布于2016年Q2,單機(jī)可以支持16個(gè)AI加速卡,最高擴(kuò)展到64,實(shí)現(xiàn)了超高的計(jì)算密度。X-MAN1.0具備4大技術(shù)特征:硬件解耦、資源池化、PCIe Fabric技術(shù)、100G RDMA高速互聯(lián)。
X-MAN2.0發(fā)布于2017年Q3,通過冷板式液冷散熱技術(shù)實(shí)現(xiàn)了超高的散熱效率。和業(yè)界主流方案一樣,X-MAN2.0可以支持8卡NVLink高速互聯(lián),差異化方面,X-MAN2.0具備2大技術(shù)特征:液冷散熱和靈活的IO支持。
隨著AI人工智能技術(shù)的快速發(fā)展,眾多AI芯片公司應(yīng)運(yùn)而生,AI芯片格局正呈現(xiàn)多元化發(fā)展趨勢。此次NIPS大會(huì)上發(fā)布的X-MAN3.0,采用了硬件系統(tǒng)模塊化、互聯(lián)接口標(biāo)準(zhǔn)化、互聯(lián)拓?fù)涓哽`活性的設(shè)計(jì)思路,既提升了多元化AI加速芯片的兼容性,也促進(jìn)了AI加速芯片生態(tài)健康、快速、可持續(xù)的發(fā)展。X-MAN3.0具備3大關(guān)鍵技術(shù)特征,包括48V供電技術(shù)、標(biāo)準(zhǔn)化的AI加速卡接口定義和靈活的互聯(lián)拓?fù)�。此次百度快速研發(fā)落地X-MAN3.0,得到了浪潮、英業(yè)達(dá)等服務(wù)器系統(tǒng)廠商的積極參與支持; 我們期待有更多的服務(wù)器系統(tǒng)合作伙伴、AI加速芯片廠商和同行加入共建開放的生態(tài),促進(jìn)整個(gè)生態(tài)圈的良性發(fā)展。
X-MAN1.0
X-MAN2.0
X-MAN3.0
X-MAN創(chuàng)造了6項(xiàng)業(yè)界第一,引領(lǐng)行業(yè)技術(shù)發(fā)展趨勢
憑借著對AI業(yè)務(wù)模型的深刻理解、扎實(shí)的硬件基礎(chǔ)架構(gòu)技術(shù)和對行業(yè)趨勢的準(zhǔn)確預(yù)判,百度設(shè)計(jì)了X-MAN AI計(jì)算平臺(tái)系列產(chǎn)品,創(chuàng)造了6項(xiàng)業(yè)界第一。其中, 2016年Q2發(fā)布的X-MAN1.0創(chuàng)造了5個(gè)業(yè)界第一:首次實(shí)現(xiàn)單機(jī)擴(kuò)展16片AI加速卡;首次實(shí)現(xiàn)4/8/16/32/64卡系統(tǒng)級彈性擴(kuò)展;首次實(shí)現(xiàn)AI計(jì)算硬件解耦架構(gòu)(注:Facebook 2017年Q1發(fā)布的Big Basin、微軟2017年Q1發(fā)布的HGX-1等都采用了相似設(shè)計(jì)理念);首次實(shí)現(xiàn)PCIe Fabric技術(shù)架構(gòu),支持按需求業(yè)務(wù)動(dòng)態(tài)分配AI計(jì)算資源;首次實(shí)現(xiàn)虛擬機(jī)多卡高速無損通信技術(shù)(native performance)。2017年Q3發(fā)布的X-MAN2.0業(yè)界首創(chuàng)將冷板式液冷散熱技術(shù)應(yīng)用到AI計(jì)算產(chǎn)品里,有效解決了高性能AI加速卡的散熱挑戰(zhàn)(注:Google 2018年Q2發(fā)布的TPU3.0也采用了相似技術(shù))。
X-MAN大規(guī)模部署,助力百度AI戰(zhàn)略快速落地
憑借著強(qiáng)大的單機(jī)計(jì)算性能、業(yè)界領(lǐng)先的多機(jī)擴(kuò)展性、靈活的AI計(jì)算資源動(dòng)態(tài)分配調(diào)整能力,X-MAN系列產(chǎn)品已在百度實(shí)現(xiàn)規(guī)模化部署,廣泛應(yīng)用于語音識(shí)別、計(jì)算機(jī)視覺、自然語音處理、無人車等基礎(chǔ)AI技術(shù)的深度學(xué)習(xí)模型訓(xùn)練,將訓(xùn)練時(shí)間從周級別縮短到天級別;服務(wù)于百度DuerOS、Apollo、ABC Cloud等核心業(yè)務(wù),助力百度AI戰(zhàn)略的快速落地。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...