還真讓DeepSeek頭號黑粉美到了。
北京時間2月25日,Anthropic傳來兩個好消息。
第一個好消息是,Anthropic發(fā)布首個“混合模型”Claude 3.7 Sonnet。在騰訊、阿里、xAI等紛紛跟上DeepSeek的腳步,推出推理模型的時候,Anthropic說“我都要”,將及時應(yīng)答和深度思考結(jié)合,拋棄了多模型堆砌的做法。
第二個好消息是,在Claude 3.7 Sonnet發(fā)布的幾乎同時,《華爾街日報》稱Anthropic接近完成35億美元的新一輪融資,估值可能達(dá)到615億美元,是此前180億美元估值的3倍有余。
Anthropic有很多頭銜。這家公司是OpenAI“叛軍”代表,是硅谷明星人工智能初創(chuàng)公司。同時,在近一個月,該公司還成為了“DeepSeek頭號黑粉”,不僅質(zhì)疑V3的600萬美元訓(xùn)練成本,還由聯(lián)合創(chuàng)始人之一親自上陣撰寫檄文,呼吁加強(qiáng)美國的芯片出口管制。
如今新模型發(fā)布,再加上融資即將超額完成的消息,Anthropic暫時頂住了DeepSeek帶來的壓力。
這不僅是屬于Anthropic的好消息,實際上,在華爾街和大眾都因DeepSeek質(zhì)疑硅谷的高支出AI戰(zhàn)略時,Anthropic的表現(xiàn)證明著神話還未破滅。對OpenAI等也在融資的企業(yè)來說,也無疑是一個積極的信號。
A
DeepSeek R1推理模型的推動下,OpenAI火速上線o3 mini,馬斯克的xAI也在上周發(fā)布Grok 3時帶上了Grok Reasoning。
而Anthropic此時選擇:來個混合大招。
此前一直傳聞Claude 4即將發(fā)布,但Anthropic這次實際上發(fā)布的是Claude 3.7 Sonnet。
Anthropic稱,Claude 3.7 Sonnet是市面上首款“混合模型”,并將立即投入使用。
此“混合”,指的是業(yè)界首個在單一架構(gòu)上整合實時應(yīng)答(Fast Thinking)和深度思考(Slow Thinking)的模型。相比而言,不管是DeepSeek的R1模型,還是OpenAI的o3-mini,都是嚴(yán)格的推理模型。
在使用R1和o3-mini時,思考過程是強(qiáng)制的,用戶只能等待,由此拖慢獲取答案的時長。但有的問題實際上并不需要長時間地思考,這時候需要用戶來判斷并切換到及時應(yīng)答的模型。
但在Claude 3.7 Sonnet這種混合模型中,用戶不必切換即可獲取實時應(yīng)答或者深度思考。
“這個模型融合了所有功能——我們的目標(biāo)是擁有一個統(tǒng)一的AI,能適用于各種場景。這樣對我們的客戶而言會更簡單一些。”Anthropic聯(lián)合創(chuàng)始人兼首席科學(xué)家賈雷德·卡普蘭(Jared Kaplan)表示。
卡普蘭將其比作人類大腦的運(yùn)行方式:有的問題需要深度思考,有的問題需要快速作答。Claude 3.7 Sonnet將這兩種能力整合在同一個模型中,而不是完全分開。
除此之外,用戶可以利用“草稿”功能,在問題比較復(fù)雜時,指導(dǎo)模型進(jìn)行更準(zhǔn)確的思考;API用戶還可以精細(xì)控制Claude 3.7 Sonnet的思考時長,甚至控制思考的預(yù)算,如告訴Claude在回答時最多思考多少個tokens。
在模型表現(xiàn)上,相較于上一代Claude 3.5 Sonnet:“Claude 3.7 Sonnet 在遵循指令、一般推理、多模態(tài)能力和自主編碼方面表現(xiàn)出色,擴(kuò)展思維在數(shù)學(xué)和科學(xué)方面提供了顯著提升。”值得一提的是,其數(shù)學(xué)、編碼能力提高10%。其中編碼能力尤為突出,在多個測試中有所展現(xiàn)。
根據(jù)SWE Bench測試數(shù)據(jù),Claude 3.7的代碼能力大幅超越DeepSeek R1、OpenAI的o1、o3模型。專注AI編程的Cursor已經(jīng)宣布集成Claude 3.7 Sonnet。
Claude 3.7 Sonnet已經(jīng)全面上線,支持免費(fèi)版、專業(yè)版、團(tuán)隊版和企業(yè)版,此外可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。不過免費(fèi)用戶目前無法使用擴(kuò)展思考模式。
在定價方面,Claude Sonnet 3.7的價格為:輸入3美元/百萬tokens,輸出15美元/百萬tokens。這與前代模型保持一致,并顯著高于競爭對手的純推理模型,如OpenAI o3 mini(輸入1.1美元/百萬tokens,輸出4.4美元/百萬tokens)和DeepSeek R1(輸入0.55美元/百萬tokens,輸出2.19美元/百萬tokens)。
在此基礎(chǔ)之上,Anthropic也同步發(fā)布了專注于代碼的Agent Claude Code,可以直接在終端運(yùn)行,幫開發(fā)者完成編程任務(wù)。
從搜索、閱讀代碼、編輯文件、編寫代碼、運(yùn)行測試,一直到將代碼提交到GitHub。不過,目前Claude Code僅作為有限的研究預(yù)覽版提供。
B
在發(fā)布大模型的同時,Anthropic正在進(jìn)行的融資也傳來好消息:
《華爾街日報》報道:“Claude背后的公司克服了因中國DeepSeek的成功引發(fā)的投資者擔(dān)憂,估值達(dá)到615億美元。”
據(jù)稱,Anthropic即將完成一輪35億美元的融資,估值將達(dá)到615億美元。最新一輪融資的投資者包括風(fēng)投公司 Lightspeed Venture Partners、General Catalyst 和 Bessemer Venture Partners。總部位于阿布扎比的投資公司 MGX 也在洽談參與事宜。
這個數(shù)字雖然離OpenAI的1570億美元估值還有距離,但是超過了xAI去年底的400億美元估值。xAI也正在尋求融資,預(yù)計估值750億美元。
要知道,這次融資之前Anthropic的估值還只有180億美元。
知情人士向《華爾街日報》透露,Anthropic最初計劃籌集20億美元,但在和投資者談判期間成功提高了這一數(shù)額。
Anthropic迎頭趕上,甚至拿出“要超越你們所有人”的架勢,這并不令人意外�?梢哉f,今天的兩個好消息,都在夯實Anthropic被貼在身上的標(biāo)簽。
Anthropic自2021年成立之初,就因其由OpenAI前員工創(chuàng)辦,而喜提“OpenAI叛軍”的稱號。
之前Anthropic已經(jīng)多次搶先OpenAI一步。如去年的“代理(Agent)”功能,OpenAI在Anthropic之后跟進(jìn)。
這次發(fā)布混合模型,高舉“反多模型堆砌方案”的大旗,也不禁讓人想到了OpenAI CEO山姆·奧特曼(Sam Altman)前不久發(fā)布的GPT 5計劃。彼時奧特曼就表示,意識到模型和產(chǎn)品功能太復(fù)雜,未來將統(tǒng)一。不承想又被Anthropic搶先一步了。
Anthropic的聯(lián)合創(chuàng)始人卡普蘭和邁克·克里格 (Mike Krieger)都表示,預(yù)計競爭對手很快也會轉(zhuǎn)向這種混合模型的方向。
另一方面,在DeepSeek R1橫空出世之后,Anthropic儼然化身“DeepSeek頭號黑粉”。
對DeepSeek的態(tài)度,硅谷大佬們大多是贊許中帶著苦澀,但言語上還算客氣。
如馬斯克在Grok 3發(fā)布前,一邊贊許DeepSeek R1很強(qiáng),給中國工程師點(diǎn)贊,但也表示DeepSeek帶來的不算AI領(lǐng)域的一次突破,并順勢夸贊了自家的模型。
奧特曼一邊大贊DeepSeek“無疑是令人印象深刻的模型”,一邊暗戳戳地表示DeepSeek用OpenAI專有模型訓(xùn)練自己的模型,可能違反了其服務(wù)條款。后來又“大方”表示“沒有起訴DeepSeek的計劃”。
而Anthropic就很不客氣了,不僅壓根不相信DeepSeek V3的訓(xùn)練成本僅有600萬美元,甚至創(chuàng)始人之一的達(dá)里奧·阿莫迪(Dario Amodei)還發(fā)布了檄文《關(guān)于DeepSeek和出口控制》。
文章的核心思想就是,由于DeepSeek V3不可能只花了600萬美元成本,而咱們又聽說他們走私了芯片,因此咱們得好好管制一下芯片出口。之前只管***和H800這些高端芯片顯然是不夠的,咱得把H20也管起來。
Anthropic當(dāng)然不愿意認(rèn),雖叫“OpenAI叛軍”,但背靠巨頭燒錢這方面,二者如出一轍。OpenAI前有微軟后有軟銀,而Anthropic則抱上了谷歌和亞馬遜的大腿。
尤其是亞馬遜,2023年就向Anthropic投資了40億美元,2024年又承諾投資40億美元。
而DeepSeek的大火又恰逢Anthropic進(jìn)行新一輪融資之時,著急上火也是情理之中的(雖然手段有點(diǎn)讓人不齒)。左手檄文打壓DeepSeek,右手發(fā)布及時應(yīng)答+深度思考的混合模型,總算穩(wěn)住了局面,如果不出意外,這一輪Anthropic將超額完成融資目標(biāo)。
C
Anthropic的兩個好消息,也可以讓硅谷暫時松口氣了。
正在融資的不止有Anthropic。
據(jù)《華爾街日報》等媒體,OpenAI正在洽談巨額融資,擬融資額至多400億美元,估值可能被推高至3000億美元。此外,xAI也在進(jìn)行新一輪融資,以750億美元估值尋求100億美元融資。他們無疑也都感受到了DeepSeek帶來的投資者擔(dān)憂。
Anthropic至少證明了,在當(dāng)下硅谷搞投入的AI路徑尚未神話破滅,“大力出奇跡”在某種程度上依然可以打動人心,雖然可能需要付出比之前多的游說成本。
但戰(zhàn)爭遠(yuǎn)沒有結(jié)束。
一方面,Anthropic依然面臨著商業(yè)化難題,而這一點(diǎn)在后DeepSeek時代顯得更加刺眼。Anthropic此前估值和收入比達(dá)到68.6倍,而OpenAI大概在42.4倍的水平。
據(jù)The Information,Anthropic的收入預(yù)計將從2025年的22億美元激增到2027年的120億美元。挑戰(zhàn)在于開支,今年Anthropic預(yù)計“燒錢”30億美元,已經(jīng)比前一年的56億美元低了。公司高層表示,預(yù)計到2027年可以停止赤字開支,實現(xiàn)盈利。
另一方面,自身商業(yè)化難解的同時,外部競爭也在加劇。
Grok 3剛剛發(fā)布,Anthropic發(fā)布混合模型,緊接著谷歌的視頻生成模型Veo 2 API也曾宣布在年初發(fā)布,還有OpenAI的GPT-4.5隨時可能降生,以及GPT-5預(yù)計在5月底發(fā)布。
開源的戰(zhàn)場也越來越熱鬧。馬斯克的xAI延續(xù)新代發(fā)布、開源上一代模型的做法,宣布將開源Grok 2。而OpenAI——此前和Anthropic一起被視為“閉源”的代表——也松了口,奧特曼面對DeepSeek的大火,直接坦言過去站在了“錯誤的一邊”,在社交媒體上發(fā)起投票,釋放將有一個“開源項目”的信號。
而眼下,DeepSeek也沒有坐以待斃,而是宣布啟動“開源周”,目前已經(jīng)開源FlashMLA(直譯為快速多頭潛在注意力機(jī)制)的代碼,以及EP通信庫。
Anthropic頂住了DeepSeek的壓力,發(fā)布混合模型、傳出超目標(biāo)融資的消息。但要讓好消息延續(xù),仍有諸多挑戰(zhàn)。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...