按:英偉達(dá)本周公布了最新季報(bào)。比起超預(yù)期的財(cái)務(wù)數(shù)據(jù),電話會(huì)議才是真正的看點(diǎn):AI的2024怎么走?“算力沙皇”的權(quán)杖,指明了潮水的方向。以下為電話會(huì)紀(jì)要內(nèi)容。第三季度又是創(chuàng)紀(jì)錄的季度。營(yíng)收達(dá)181億美元,環(huán)比增長(zhǎng)34%,同比增長(zhǎng)超過(guò)200%。
遠(yuǎn)高于我們160 億美元的預(yù)期。從數(shù)據(jù)中心開(kāi)始,基于Hopper Tensor Core GPU架構(gòu)的 NVIDIA HGX 平臺(tái)的持續(xù)增長(zhǎng),以及InfiniBand和網(wǎng)絡(luò),推動(dòng)數(shù)據(jù)中心收⼊創(chuàng)紀(jì)錄地達(dá)到145 億美元,環(huán)比增長(zhǎng)1%,同比增長(zhǎng)279%。
NVIDIA HGX與InfiniBand本質(zhì)上是AI超級(jí)計(jì)算機(jī)和數(shù)據(jù)中心基礎(chǔ)設(shè)施的參考架構(gòu)。一些最令人興奮的生成式AI 應(yīng)用程序都是在 NVIDIA 上構(gòu)建和運(yùn)行的,包括 Adobe Firefly、ChatGPT、Microsoft 365 Copilot、Zoom AI Companion等。
我們的數(shù)據(jù)中心計(jì)算收⼊比去年增長(zhǎng)了四倍,網(wǎng)絡(luò)收⼊幾乎增長(zhǎng)了兩倍。對(duì)訓(xùn)練和推理大型語(yǔ)⾔模型、深度學(xué)習(xí)、推薦系統(tǒng)和生成式 AI 應(yīng)用的基礎(chǔ)設(shè)施的投資正在推動(dòng)對(duì)NVIDIA加速計(jì)算的廣泛強(qiáng)勁需求。推理現(xiàn)在是NVIDIA AI計(jì)算的主要工作負(fù)載。
消費(fèi)互聯(lián)網(wǎng)公司和企業(yè)在第三季度推動(dòng)了驚人的環(huán)比增長(zhǎng),約占我們數(shù)據(jù)中心收⼊的一半,并且超過(guò)了總體增長(zhǎng)。
Adobe、Databricks、Snowflake 和 ServiceNow等企業(yè)軟件公司正在向其平臺(tái)添加AI副駕駛和助理。
本季度我們數(shù)據(jù)中心收⼊的另一半。所有超大規(guī)模CSP 以及全球范圍內(nèi)一系列新的GPU專用CSP的需求都很強(qiáng)勁,這些CS正在快速增長(zhǎng),以應(yīng)對(duì)AI領(lǐng)域的新市場(chǎng)機(jī)遇NVIDIA *** Tensor Core GPU實(shí)例現(xiàn)在幾乎在每個(gè)帶有實(shí)例的云中都可用需求量很大。今年每個(gè)季度我們都大幅增加供應(yīng),以滿足強(qiáng)勁的需求,并預(yù)計(jì)明年將繼續(xù)這樣做。
我們還將有更廣泛、更快的產(chǎn)品發(fā)布節(jié)奏,以滿足不斷增長(zhǎng)和多樣化的人工智能機(jī)會(huì)。本季度末,美國(guó)政府宣布了一套針對(duì)中國(guó)和其他市場(chǎng)(包括越南和某些中東國(guó)家)的新出口管制法規(guī)。這些法規(guī)要求我們的許多產(chǎn)品獲得出口許可證,包括我們的Hopper和Ampere 100和800系列以及其他幾種產(chǎn)品。在過(guò)去的幾個(gè)季度中,我們對(duì)中國(guó)和其他受影響目的地的銷售源自目前需要遵守許可要求的產(chǎn)品,一直貢獻(xiàn)了數(shù)據(jù)中心收⼊的約20% 至25%。
我們的訓(xùn)練集群包括超過(guò)10,000 個(gè)*** GPU,比6月份增加了3倍,反映出非常⾼效的擴(kuò)展。⾼效擴(kuò)展是生成人工智能的關(guān)鍵要求,因?yàn)榉▽W(xué)碩士每年都在以一個(gè)數(shù)量級(jí)增長(zhǎng)。Microsoft Azure 在幾乎相同的集群上取得了類似的結(jié)果,展⽰了NVIDIA AI在公共云部署中的效率。目前,網(wǎng)絡(luò)業(yè)務(wù)的年收⼊運(yùn)行率已超過(guò)10億美元。
我們的增長(zhǎng)是由對(duì)InfiniBand的特殊需求推動(dòng)的,該需求同比增長(zhǎng)了五倍。InfiniBand 對(duì)于獲得培訓(xùn) LLM 所需的規(guī)模和性能至關(guān)重要。微軟上周明確指出了這一點(diǎn),強(qiáng)調(diào) Azure使用超過(guò)29,000 英里的InfiniBand 線路,足以繞地球一圈。
我們正在將NVIDIA網(wǎng)絡(luò)擴(kuò)展到以太網(wǎng)領(lǐng)域。我們?nèi)碌腟pectrum-X端到端以太網(wǎng)產(chǎn)品采用專為AI打造的技術(shù),將于明年*季度推出。
與傳統(tǒng)以太網(wǎng)產(chǎn)品相比,Spectrum-X可以實(shí)現(xiàn)AI通信網(wǎng)絡(luò)性能提⾼1.6 倍。我還要介紹一下我們的軟件和服務(wù)產(chǎn)品的最新情況,我們已經(jīng)開(kāi)始看到這些軟件和服務(wù)產(chǎn)品的出色采用。我們有望以10億美元的經(jīng)常性軟件支持和服務(wù)產(chǎn)品年化收⼊結(jié)束今年。我們看到了中期增長(zhǎng)的兩個(gè)主要機(jī)會(huì),即我們的DGX云服務(wù)和我們的NVIDIA AI企業(yè)軟件。
游戲收⼊達(dá)28.6 億美元,環(huán)比增長(zhǎng)15%,同比增長(zhǎng)超過(guò)80%,重要的返校購(gòu)物季需求旺盛,NVIDIA RTX 光線追蹤和AI技術(shù)現(xiàn)在價(jià)格低至299美元。我們?yōu)橛螒蛲婕液蛣?chuàng)作者帶來(lái)了有史以來(lái)*的陣容。即使在PC市場(chǎng)表現(xiàn)低迷的背景下,游戲數(shù)量也比新冠疫情前的⽔平翻了一番。
ProViz的收⼊為4.16億美元,環(huán)比增長(zhǎng) 10%,同比增長(zhǎng)108%。NVIDIA RTX是專業(yè)設(shè)計(jì)、工程和模擬用例的*工作站平臺(tái),而人工智能正在成為強(qiáng)大的需求驅(qū)動(dòng)力。早期應(yīng)用包括用于醫(yī)療保健中的AI成像的IMP以及智能空間和公共部⻔中的邊緣AI。我們推出了基于 NVIDIA RTX、Ada Lovelace、Generation GPU 和 ConnectX、SmartNIC 的全新桌面工作站系列,其 AI處理、光線追蹤和圖形性能是前幾代產(chǎn)品的2倍。
我們宣布在 Microsoft Azure 上提供兩項(xiàng)用于汽車數(shù)字化的新Omniverse云服務(wù):虛擬工⼚模擬引擎和自動(dòng)駕駛汽車模擬引擎。轉(zhuǎn)向汽車領(lǐng)域。收⼊為2.61億美元,環(huán)比增長(zhǎng)3%,同比增長(zhǎng)4%,主要得益于基于NVIDIA DRIVE Orin SoC的自動(dòng)駕駛平臺(tái)的持續(xù)增長(zhǎng)以及全球 OEM 客戶的AI座艙解決方案的不斷增長(zhǎng)。我們擴(kuò)大了與富士康的汽車合作伙伴關(guān)系,納⼊了我們的下一代汽車 SoC NVIDIA Drive Thor。
富士康已成為電動(dòng)汽車的ODM。我們的合作伙伴關(guān)系為富士康提供了標(biāo)準(zhǔn)的AV傳感器和計(jì)算平臺(tái),供其客戶輕松構(gòu)建*進(jìn)、安全的軟件定義汽車�,F(xiàn)在,我們將把其余部分的損益表GAAP毛利率擴(kuò)大到 74%,非 GAAP毛利率擴(kuò)大到 75%,這得益于數(shù)據(jù)中心銷售額的增加和凈庫(kù)存儲(chǔ)備的減少,其中包括1個(gè)百分點(diǎn)的收益釋放此前預(yù)留的Ampere GPU架構(gòu)產(chǎn)品相關(guān)庫(kù)存。
運(yùn)營(yíng)費(fèi)用增長(zhǎng)12%,非 GAAP運(yùn)營(yíng)費(fèi)用增長(zhǎng)10%,主要反映了薪酬和福利的增加。
Q&A環(huán)節(jié)
Q1:您認(rèn)為就生成型人工智能市場(chǎng)的出貨量而⾔,當(dāng)前處于怎么樣的位置?因?yàn)楫?dāng)我只看你們數(shù)據(jù)中心的軌跡時(shí),明年數(shù)據(jù)中心支出將接近 30%。那么您正在關(guān)注哪些指標(biāo)?我們?cè)贏I這個(gè)市場(chǎng)中處于什么位置?
A1:從歷史上看,過(guò)去幾個(gè)季度,中國(guó)和其他一些受影響的目的地約占我們數(shù)據(jù)中心收⼊的 20%至25%。我們預(yù)計(jì),隨著進(jìn)⼊第四季度,這一數(shù)字將大幅下降。
出口管制將對(duì)我們的中國(guó)業(yè)務(wù)產(chǎn)生負(fù)面影響,即使從長(zhǎng)遠(yuǎn)來(lái)看,我們也無(wú)法清楚地了解這種影響的嚴(yán) 重程度。不過(guò),我們正在努力擴(kuò)展我們的數(shù)據(jù)中心產(chǎn)品組合,以可能提供不需要許可證的新的符合法規(guī)的解決方案。
這些產(chǎn)品可能會(huì)在未來(lái)幾個(gè)月內(nèi)上市。然而,我們預(yù)計(jì)他們的貢獻(xiàn)占第四季度收⼊的百分比不會(huì)很大或有意義。
生成式人工智能是我們幾⼗年來(lái)⻅過(guò)的*的軟件和硬件TAM 擴(kuò)展。其核心,主要是基于檢索的計(jì)算方法,幾乎所有你所做的事情都是從某個(gè)地方的存儲(chǔ)中檢索出來(lái)的,現(xiàn)在已經(jīng)得到了增強(qiáng),添加了生成方法,并且它幾乎發(fā)生了變化一切。
您可以看到⽂本到⽂本、⽂本到圖像、⽂本到視頻、⽂本到 3D、⽂本到蛋⽩質(zhì)、⽂本到化學(xué)品。這些是過(guò)去由人類處理和輸⼊的東西,現(xiàn)在這些是生成方法。我們?cè)L問(wèn)數(shù)據(jù)的方式已經(jīng)改變。它曾經(jīng)基于顯式查詢。
因此,我們對(duì)與 SAP 和 Dropbox 以及您將聽(tīng)到的許多其他合作伙伴所做的工作感到非常興奮。真正有影響力的領(lǐng)域之一是軟件行業(yè),該行業(yè)價(jià)值約一萬(wàn)億美元,在過(guò)去幾⼗年里一直在構(gòu)建⼿動(dòng)使用的工具�,F(xiàn)在出現(xiàn)了一個(gè)全新的軟件部分,稱為副駕駛和輔助。
這些工具不需要⼿動(dòng)使用,而是有副駕駛來(lái)幫助您使用它。因此,當(dāng)然,我們將繼續(xù)這樣做,而不是許可軟件,但我們還將聘請(qǐng)副駕駛和助理來(lái)幫助我們使用該軟件。我們將把所有這些副駕駛和助⼿連接到人工智能團(tuán)隊(duì)中,這將是現(xiàn)代版本的軟件、現(xiàn)代版本的企業(yè)業(yè)務(wù)軟件。因此,軟件和軟件完成方式的轉(zhuǎn)變正在驅(qū)動(dòng)底層的硬件。
現(xiàn)在我們有了更好的方法,稱為加速計(jì)算,您可以節(jié)省一個(gè)數(shù)量級(jí)的能源,可以節(jié)省一個(gè)數(shù)量級(jí)的時(shí)間,或者可以通過(guò)使用加速來(lái)節(jié)省一個(gè)數(shù)量級(jí)的成本。因此,如果您愿意的話,加速計(jì)算正在將通用計(jì)算轉(zhuǎn)變?yōu)檫@種新方法。新型數(shù)據(jù)中心進(jìn)一步增強(qiáng)了這一點(diǎn)。這就是您剛才談到的傳統(tǒng)數(shù)據(jù)中心,我們大約占其中的三分之一。
但是有一種新的數(shù)據(jù)中心類型,這種新的數(shù)據(jù)中心類型與過(guò)去的數(shù)據(jù)中心不同,過(guò)去的數(shù)據(jù)中心運(yùn)行著大量應(yīng)用程序,由許多使用相同基礎(chǔ)設(shè)施的不同租戶的人使用,并且該數(shù)據(jù)中心存儲(chǔ)了大量⽂件。
這些新的數(shù)據(jù)中心是很少的應(yīng)用程序,即使不是一個(gè)應(yīng)用程序,也基本上由一個(gè)租戶使用。它處理數(shù)據(jù),訓(xùn)練模型,生成人工智能,我們將這些新的數(shù)據(jù)中心稱為人工智能工⼚。我們看到幾乎每個(gè)國(guó)家都在建造人工智能工⼚。
因此,如果你看看我們?cè)跀U(kuò)張、向這種新計(jì)算方法的過(guò)渡中所處的位置,這是你在大型語(yǔ)⾔模型初創(chuàng)公司、生成人工智能初創(chuàng)公司和消費(fèi)互聯(lián)網(wǎng)公司中看到的*波浪潮。
我們正在加大力度。與此同時(shí),在這種情況不斷增加的同時(shí),您會(huì)看到我們開(kāi)始與企業(yè)軟件公司合作,他們希望構(gòu)建聊天機(jī)器人和副駕駛,并提供幫助以增強(qiáng)他們平臺(tái)上的工具。你會(huì)看到專⻔針對(duì)GPU的 CSP在世界各地涌現(xiàn),他們真正致力于做一件事,那就是處理人工智能。你會(huì)看到主權(quán) 人工智能基礎(chǔ)設(shè)施、人民和國(guó)家現(xiàn)在認(rèn)識(shí)到他們必須利用他們的技術(shù)。擁有自己的數(shù)據(jù),保留自己 的數(shù)據(jù),保留自己的⽂化,處理這些數(shù)據(jù),并開(kāi)發(fā)自己的人工智能,你在印度看到了這一點(diǎn)。
因此,我認(rèn)為,隨著生成式人工智能浪潮在每個(gè)行業(yè)、每個(gè)公司、每個(gè)地區(qū)傳播,你會(huì)看到新的發(fā)展。因此,我們正處于這種拐點(diǎn)、這種計(jì)算轉(zhuǎn)變的開(kāi)始。
Q2:我想詢問(wèn)有關(guān)業(yè)務(wù)網(wǎng)絡(luò)方面的問(wèn)題。如何看待以太網(wǎng)的演進(jìn)?
A2:我們的網(wǎng)絡(luò)業(yè)務(wù)已達(dá)到10億美元以上,而且規(guī)模還將進(jìn)一步擴(kuò)大。我們最近在我們的網(wǎng)絡(luò)業(yè)務(wù)中添加了一個(gè)新的網(wǎng)絡(luò)平臺(tái)。但絕大多數(shù)專用的大型AI工⼚都在InfiniBand上進(jìn)行標(biāo)準(zhǔn)化。其原因不僅是因?yàn)樗臄?shù)據(jù)速率和延遲,而且它在網(wǎng)絡(luò)中移動(dòng)流量的方 式非常重要。
有了InfiniBand,有了軟件定義的網(wǎng)絡(luò),我們就可以做到控制、自適應(yīng)路由、性能隔離和噪聲隔離,當(dāng)然更不用說(shuō)InfiniBand的數(shù)據(jù)速率和低延遲以及非常低的開(kāi)銷了,這是很自然的 InfiniBand 的一部分。因此,InfiniBand 不僅僅是一個(gè)網(wǎng)絡(luò),它還是一個(gè)計(jì)算結(jié)構(gòu)。我們?cè)诮Y(jié)構(gòu)中加⼊了許多軟件定義的功能,包括計(jì)算。
例如,最近我們談到了我們正在創(chuàng)建的模型之一,它被稱為Shipnemo,我們正在構(gòu)建許多其他模型。我們將在公司內(nèi)部創(chuàng)建數(shù)⼗、數(shù)百個(gè)自定義人工智能模型。
我們所做的就是發(fā)明了這個(gè)新平臺(tái),它擴(kuò)展了以太網(wǎng),不會(huì)取代以太網(wǎng),它 100% 兼容以太網(wǎng),并且針對(duì)東西向流量(計(jì)算結(jié)構(gòu)所在的位置)進(jìn)行了優(yōu)化。它通過(guò) BlueField 的端到端解決方案以及我們的頻譜交換機(jī)添加到以太網(wǎng)中,使我們能夠執(zhí)行 InfiniBand 中的一些功能(不是全部, 而是部分功能),并且我們?nèi)〉昧顺錾慕Y(jié)果。
我們進(jìn)⼊市場(chǎng)的方式是與已經(jīng)提供我們的計(jì)算解決方 案的大型企業(yè)合作伙伴一起進(jìn)⼊市場(chǎng)。因此,惠普、戴爾和聯(lián)想擁有 NVIDIA AI 堆棧、NVIDIA AI 企業(yè)軟件堆棧,現(xiàn)在他們與BlueField集成,并捆綁銷售其Spectrum交換機(jī)。
他們將能夠憑借龐大的銷售隊(duì)伍和龐大的經(jīng)銷商網(wǎng)絡(luò),為世界各地的企業(yè)客戶提供完全集成的(如果你愿意的話)至少端到端優(yōu)化的人工智能解決方案。
Q3:我想知道您是否可以多談?wù)?Grace Hopper,您如何看待利用某些微處理器的能力,如何 將其視為TAN expander,以及您認(rèn)為使用 Grace Hopper與更傳統(tǒng)的***應(yīng)用程序相比有哪些應(yīng)用 程序?
A3:Grace Hopper 已投⼊生產(chǎn),目前正在大批量生產(chǎn)。我們預(yù)計(jì),明年,隨著我們?cè)?#12220;性能計(jì)算和人工智能基礎(chǔ)設(shè)施方面取得的所有設(shè)計(jì)勝利,我們將非�?斓貜奈覀兊�*個(gè)數(shù)據(jù)中心CPU發(fā)展到價(jià)值數(shù)⼗億美元的產(chǎn)品線。
這對(duì)我們來(lái)說(shuō)將是一個(gè)非常龐大的產(chǎn)品線。它能夠創(chuàng)建同時(shí)具有非�?斓膬�(nèi)存和非常大的內(nèi)存的計(jì)算節(jié)點(diǎn)。在向量數(shù)據(jù)庫(kù)或語(yǔ)義搜索領(lǐng)域,稱為 RAG(檢索增強(qiáng)生成),這樣您就可以讓生成式AI模型能夠在生成響應(yīng)之前引用專有數(shù)據(jù)或事實(shí)數(shù)據(jù)。
這樣,生成模型一方面仍然能夠自然地與您交互,另一方面能夠引用事實(shí)數(shù)據(jù)、專有數(shù)據(jù)或特定領(lǐng)域的數(shù)據(jù)、您的數(shù)據(jù),并且能夠與上下⽂相關(guān)相關(guān)并減少幻覺(jué)。例如,對(duì)于Grace Hopper 來(lái)說(shuō),這個(gè)特定的用例確實(shí)非常棒。它還為那些真正想要擁有不同于x86的CPU的客戶提供服務(wù)。也許是歐洲超級(jí)計(jì)算中心或歐洲公司想要建立自己的ARM生態(tài)系統(tǒng)并想要建立整個(gè)堆棧,或者是CSP決定轉(zhuǎn)向ARM,因?yàn)樗麄冏约旱亩ㄖ艭PU是基于ARM的。
Q4:想問(wèn)一下你們的收⼊可⻅度。您認(rèn)為數(shù)據(jù)中心能夠發(fā)展到2025年嗎?
A4:*相信數(shù)據(jù)中心能夠在 2025年之前實(shí)現(xiàn)增長(zhǎng)。這有幾個(gè)原因。我們正在大幅擴(kuò)大供應(yīng)。我們已經(jīng)擁有世界上最廣泛、*、最有能力的供應(yīng)鏈之一。人們認(rèn)為GPU是一個(gè)芯⽚,但 HGX ***(Hopper HGX)有 35,000個(gè)零件。它重 70 磅。其中⼋個(gè)籌碼是Hopper 的。它是一臺(tái)超級(jí)計(jì)算機(jī),因此測(cè)試超級(jí)計(jì)算機(jī)的*方法是使用另一臺(tái)超級(jí)計(jì)算機(jī)。
因此,我們HGX供應(yīng)鏈的各個(gè)方面都很復(fù)雜,而我們這里擁有的出色團(tuán)隊(duì)確實(shí)令人難以置信地?cái)U(kuò)展了該供應(yīng)鏈。更不用說(shuō),我們所有的HGX都與NVIDIA網(wǎng)絡(luò)連接,而網(wǎng)絡(luò)、收發(fā)器、NIC、電纜、交換機(jī),其復(fù)雜性令人難以置信。
正如我之前提到的,我們有新客戶。不同的地區(qū)正在建立 GPU 專家云,來(lái)自世界各地的主權(quán)人工智能云,因?yàn)槿藗円庾R(shí)到他們無(wú)法承擔(dān)將自己國(guó)家的知識(shí)、國(guó)家⽂化出口給其他人然后將人工智能轉(zhuǎn)售給他們的費(fèi)用。
他們必須,他們應(yīng)該,他們有技能,當(dāng)然,與我們結(jié)合,我們可以幫助他們做到這一點(diǎn),建立他們的國(guó)家人工智能所以他們要做的*件事就是創(chuàng)建他們的人工智能云,國(guó)家人工智能 云。您還看到我們現(xiàn)在正在成長(zhǎng)為企業(yè)。
企業(yè)市場(chǎng)有兩條路徑。*條路當(dāng)然是現(xiàn)成的AI當(dāng)然還有ChatGPT,令人難以置信的現(xiàn)成的AI還有其他的。還有專有的人工智能,因?yàn)镾erviceNow和SAP等軟件公司以及許多其他公司無(wú)法承擔(dān)將其公司的智能外包給其他人的費(fèi)用。
我們有一項(xiàng)名為AI Foundry的新服務(wù),我們利用NVIDIA的功能為他們提供服務(wù)。下一個(gè)是企業(yè)構(gòu)建自己的自定義人工智能、自己的自定義聊天機(jī)器人、自己的自定義規(guī)則。而且這種能力正在全世界范圍內(nèi)傳播。我們?yōu)樵撌袌?chǎng)提供服務(wù)的方式是使用整個(gè)系統(tǒng)堆棧,其中包括我們的計(jì)算、網(wǎng)絡(luò)和交換機(jī),運(yùn)行我們稱為NVIDIA AI Enterprise的軟件堆棧,并通過(guò)我們的市場(chǎng)合作伙伴HP、Dell、聯(lián)想等獲取該軟件堆棧。
因此,我們看到生成式人工智能的浪潮從初創(chuàng)公司和通信服務(wù)提供商開(kāi)始轉(zhuǎn)向消費(fèi)者互聯(lián)網(wǎng)公司,轉(zhuǎn)向企業(yè)軟件平臺(tái),轉(zhuǎn)向企業(yè)公司。最終,你們看到我們花費(fèi)大量精力的領(lǐng)域之一與工業(yè)生成人工智能有關(guān),這就是NVIDIA AI 和 NVIDIA Omniverse的結(jié)合之處,這是一項(xiàng)非常非常令人興奮的工作。
Q5:您提到您將在未來(lái) 幾個(gè)月內(nèi)推出符合法規(guī)的產(chǎn)品,但對(duì)第四季度收⼊的貢獻(xiàn)應(yīng)該相對(duì)有限。這是一個(gè)時(shí)間問(wèn)題嗎?它是否會(huì)成為4月份及以后數(shù)據(jù)中心重新加速和增長(zhǎng)的來(lái)源?或者價(jià)格點(diǎn)對(duì)未來(lái)收⼊的貢獻(xiàn)是 否應(yīng)該相對(duì)有限?然后上周發(fā)布的AI Foundry服務(wù)公告,盈利模式將如何運(yùn)作?主要是服務(wù)和軟件收⼊嗎?我們應(yīng)該如何考慮長(zhǎng)期機(jī)會(huì)?這將是微軟獨(dú)有的,還是您也有計(jì)劃擴(kuò)展到其他合作伙伴?
A5:關(guān)于我們可以向中國(guó)客戶提供的潛在新產(chǎn)品的問(wèn)題。設(shè)計(jì)和開(kāi)發(fā)這些新產(chǎn)品都 是一個(gè)重要的過(guò)程。正如我們所討論的,我們將確保我們也與美國(guó)政府充分討論我們對(duì)這些產(chǎn)品的 意圖�?紤]到我們本季度的狀況,本季度已經(jīng)過(guò)去幾周了,我們需要一些時(shí)間來(lái)仔細(xì)研究并與客戶討論他們 對(duì)我們擁有的這些新產(chǎn)品的需求和愿望。
展望未來(lái),無(wú)論是中期還是長(zhǎng)期,很難說(shuō)我們可以與美國(guó)政府合作生產(chǎn)什么,以及我們中國(guó)客戶的利益是什么。因此,我們?nèi)匀粚W⒂跒橹袊?guó)客戶找到適當(dāng)?shù)钠胶�,但目前還很難說(shuō)。
AI Foundry 面臨著巨大的機(jī)遇,而且意義重大。首先,每個(gè)公司都有自己的核心智力。它構(gòu)成了我們的公司。我們的數(shù)據(jù),我們的領(lǐng)域?qū)I(yè)知識(shí)。就很多公司而⾔,我們創(chuàng)造工具,世界上大多數(shù)軟件公司都是工具平臺(tái),而這些工具今天被人們使用。
在未來(lái),它將被我們雇傭的一大堆人工智能增強(qiáng)的人們使用。這些人工智能平臺(tái)必須⾛向世界, 你就會(huì)看到,我們已經(jīng)宣布了一些,SAP、ServiceNow、Dropbox、Getty,還有許多其他平臺(tái)即將推出。因是因?yàn)樗麄儞碛凶约旱膶S腥斯ぶ悄埽麄兿胍约旱膶S腥斯ぶ悄�,他們無(wú)法承擔(dān) 外包情報(bào)和分發(fā)數(shù)據(jù)的費(fèi)用,也無(wú)法將⻜輪交給其他公司來(lái)為他們構(gòu)建人工智能。
我們有幾樣?xùn)|西對(duì)于代工⼚來(lái)說(shuō)是非常重要的,就像臺(tái)積電是一家代工⼚一樣。你必須擁有 人工智能技術(shù)。如您所知,我們擁有令人難以置信的深度人工智能能力、人工智能技術(shù)能力。其次,你必須擁有*實(shí)踐,已知的實(shí)踐,通過(guò)發(fā)明人工智能模型來(lái)處理數(shù)據(jù)的技能,以創(chuàng)建有護(hù)欄、微調(diào)等等的人工智能。
第三件事是你需要工⼚,這就是 DGX Cloud。我們的人工智能模型稱為人工智能基礎(chǔ)。如果你 愿意的話,我們用于創(chuàng)建 AI 的 CAD 系統(tǒng)稱為 NEMO,它們?cè)?NVIDIA 的工⼚(我們稱為 DGX Cloud)上運(yùn)行。
我們?cè)谠贫�、本地和任何地方都擁有龐大的安裝基礎(chǔ)。而且它是安全的、安全地修補(bǔ)、不斷修補(bǔ)、優(yōu)化和支持。我們稱之為 NVIDIA AI Enterprise。NVIDIA AI Enterprise 的價(jià)格為每位GP每年4,500 美元。這就是我們的商業(yè)模式。我們的商業(yè)模式基本上是一個(gè)許可證。然后,我們的客戶憑借該基本許可證, 可以在此基礎(chǔ)上構(gòu)建他們的盈利模型。在很多方面,批發(fā)變成了零售。
他們可以針對(duì)每個(gè)實(shí)例擁有一個(gè)訂閱許可證基礎(chǔ),也可以針對(duì)每個(gè)使用情況進(jìn)行訂閱。他們可以 采取很多不同的方式來(lái)創(chuàng)建自己的商業(yè)模式,但我們的方式基本上就像軟件許可證,就像操 作系統(tǒng)一樣。因此,我們的業(yè)務(wù)模式是幫助您創(chuàng)建自定義模型,然后在 NVIDIA AI Enterprise 上運(yùn)行這些自定義模型。
Q6:我想知道如果沒(méi)有中國(guó)的限制,第四季度的指導(dǎo)值會(huì)更⾼嗎?或者 您的供應(yīng)是否受到限制,只能將本可以運(yùn)往中國(guó)其他地方的貨物轉(zhuǎn)運(yùn)。我想沿著這些思路,如果您能讓 我們了解您目前在數(shù)據(jù)中心的交貨時(shí)間以及像當(dāng)前的情況,它是否會(huì)降低這些交貨時(shí)間,因?yàn)?您有一些零件可以立即發(fā)貨嗎?
A6:是的,在某些情況下,我們每個(gè)季度都在努力改善我們 的供應(yīng)。我們?cè)诿總(gè)季度的增長(zhǎng)方面做得非常扎實(shí),這決定了我們的收⼊。但由于我們對(duì)第四季度的展望中沒(méi)有中國(guó),我們?nèi)栽谂Ω纳莆覀兊墓⿷?yīng),并計(jì)劃在明年繼續(xù)增長(zhǎng),并為此努力。
Q7:也許你可以花一點(diǎn)時(shí)間討論大模型在推理方面的演進(jìn)以及你的公司如何定位于此而不是較小的模型推理。其次,直到一兩個(gè)月前,我還從未真正收到過(guò)任何關(guān)于人工智能工作負(fù)載的數(shù)據(jù)處理部分的問(wèn)題。也許您可以談?wù)?CUDA 如何加速這些工作負(fù)載
A7:我們可以創(chuàng)建 TensorRT-LLM,因?yàn)?CUDA 是可編程的。如果 CUDA 和我們的 GPU 不具備如此可編程性,我們就很難以現(xiàn)在的速度改進(jìn)軟件堆棧。同一 GPU 上的 TensorRTLLM 無(wú)需任何人接觸任何東西即可將性能提⾼兩倍。
當(dāng)然,最重要的是,我們的創(chuàng)新步伐如此之快,H200 將其提⾼了兩倍。因此,我們的推理成本在大約一年的時(shí)間內(nèi)降低了四倍。所以這真的很難跟上。現(xiàn)在,每個(gè)人都喜歡我們的推理引擎的原因是因?yàn)槲覀兊陌惭b基礎(chǔ)。20 年來(lái),我們一直致力于我們的客戶群。
我們擁有的安裝基礎(chǔ)不僅在每個(gè)云中都是*的,而且每個(gè)企業(yè)系統(tǒng)制造商都可以提供。幾乎每個(gè)行業(yè)的公司都在使用它。無(wú)論何時(shí)您看到 NVIDIA GPU,它都會(huì)運(yùn)行我們的堆棧。它在架構(gòu)上是兼容的。
NVIDIA 的平臺(tái)穩(wěn)定性確定性是每個(gè)人首先在我們的基礎(chǔ)上構(gòu)建以及每個(gè)人首先在我們的基礎(chǔ)上進(jìn)行優(yōu)化的原因。您所做的所有工程和所有工作以及您在 NVIDIA基礎(chǔ)上構(gòu)建的所有技術(shù)發(fā)明都會(huì)為使用我們GPU的每個(gè)人帶來(lái)好處。
我們擁有如此龐大的安 裝基礎(chǔ),云中有數(shù)以百萬(wàn)計(jì)的GPU,來(lái)自人們PC的1億個(gè) GPU,幾乎世界上的每個(gè)工作站,它們?cè)诩軜?gòu)上都是兼容的。因此,如果您是一個(gè)推理平臺(tái)并且正在部署推理應(yīng)用程序,那么您基本上是一個(gè)應(yīng)用程序提供商,并且作為軟件應(yīng)用程序提供商,您正在尋找大型安裝基礎(chǔ)。
數(shù)據(jù)處理,在訓(xùn)練模型之前,您必須整理數(shù)據(jù)。你必須推斷數(shù)據(jù),也許你必須用合成數(shù)據(jù) 來(lái)擴(kuò)充數(shù)據(jù),所以你處理數(shù)據(jù),清理數(shù)據(jù),對(duì)⻬數(shù)據(jù),規(guī)范化數(shù)據(jù)。所有這些數(shù)據(jù)都不是以字節(jié)和兆字節(jié)為單位來(lái)衡量的,而是以太字節(jié)和拍字節(jié)為單位來(lái)衡量的。在數(shù)據(jù)工程之前、 在進(jìn)行培訓(xùn)之前進(jìn)行的數(shù)據(jù)處理量非常大。
它可能代表您最終創(chuàng)建數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)服務(wù)所需工作量的 30%、40%、50%。所以數(shù)據(jù)處理只 是一個(gè)重要的部分。我們加速 Spark,我們加速 Python。我們剛剛做的最酷的事情之一是cuDF pandus。
Tandas 是世界上最成功的數(shù)據(jù)科學(xué)框架,PANDAS 現(xiàn)在由 NVIDIA CUDA 加速, 開(kāi)箱即用,無(wú)需一行代碼。因此,加速度確實(shí)非常驚人,人們對(duì)此感到非常興奮。PANDAS 的設(shè)計(jì)只 有一個(gè)目的,只有一個(gè)目的,即真正用于數(shù)據(jù)科學(xué)的數(shù)據(jù)處理。NVIDIA CUDA為您提供了這一切。
Q8:我們?nèi)绾慰创銈兊难邪l(fā)、運(yùn)營(yíng)支出增長(zhǎng)前景,以支持更積極、更擴(kuò)展的未來(lái)路線圖,但更 重要的是,團(tuán)隊(duì)正在做什么來(lái)管理和推動(dòng)執(zhí)行所有這些復(fù)雜性?
A8:首先,我們加快執(zhí)行速度有 一個(gè)根本原因,就是因?yàn)樗鼜母旧辖档土顺杀�。TensorRT LLM 和H200 的結(jié)合將我們客戶的大型模型推理成本降低了四倍。
因此,我們希望加快我們的路線圖。第二個(gè)原因是擴(kuò)大生成式人工智能的覆蓋范圍世界上數(shù)據(jù)中心配置的數(shù)量。每種云中都有NVIDIA的⾝影,但沒(méi)有一種云是相同的。NVIDIA 與每家云服務(wù)提供商合作,但他們的網(wǎng)絡(luò)控制平面安全狀況都不相同。
我們現(xiàn)在正在將所有這些產(chǎn)品推向市場(chǎng)。因此,復(fù)雜性當(dāng)然包括所有的技術(shù)、細(xì)分市場(chǎng)和速度。它包括這樣一個(gè)事實(shí):我們?cè)诩軜?gòu)上與其中每一個(gè)都兼容。它包括我們創(chuàng)建的所有特定于域的庫(kù)。這就是為什么每家計(jì)算機(jī)公司都能不假思索地將 NVIDIA 納⼊其路線圖并將其推向市場(chǎng)的原因。
原因是因?yàn)橛惺袌?chǎng)需求。醫(yī)療保健有市場(chǎng)需求。當(dāng)然,人工智能、⾦融服務(wù)、超級(jí)計(jì)算、量⼦計(jì)算都有市場(chǎng)需求。我們擁有特定領(lǐng)域庫(kù)的市場(chǎng)和細(xì)分市場(chǎng)列表非常廣泛。最后,我們?yōu)閿?shù)據(jù)中心提供了端到端的解決方案。InfiniBand 網(wǎng)絡(luò)、Ethernet、 x86、ARM,幾乎提供了解決方案、技術(shù)解決方案和軟件堆棧的所有排列組合。
這意味著擁有最多數(shù)量的生態(tài)系統(tǒng)軟件開(kāi)發(fā)人員、*的系統(tǒng)制造商生態(tài)系統(tǒng)、*和最廣泛的分銷合作伙伴網(wǎng)絡(luò),以及最終*的覆蓋范圍。這當(dāng)然需要大量的能量。但真正將它們結(jié)合 在一起的是我們幾⼗年前做出的一個(gè)偉大決定,即一切在架構(gòu)上都是兼容的。當(dāng)我們開(kāi)發(fā)一種 在一個(gè)GPU上運(yùn)行的領(lǐng)域特定語(yǔ)⾔時(shí),它會(huì)在每個(gè)GPU上運(yùn)行當(dāng)我們針對(duì)云優(yōu)化 TensorRT 時(shí),我們也會(huì)針對(duì)企業(yè)進(jìn)行優(yōu)化。
當(dāng)我們做一些事情帶來(lái)新功能、新庫(kù)、新功能或新開(kāi)發(fā)人員時(shí),他們會(huì)立即從我們的所有影響力中 受益。因此,這種與架構(gòu)兼容的原則已經(jīng)持續(xù)了幾⼗年,這也是NVIDIA仍然非常非常⾼效的原因之一。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...