大廠趕超ChatGPT

2023/07/21 17:32 新摘商業(yè)評(píng)論洛枳辛夷

　　ChatGPT上線的兩百天里，國內(nèi)大模型發(fā)展開啟“狂飆”模式。

　　據(jù)稱，中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè)。

　　大模型進(jìn)化場(chǎng)，講究一個(gè)百�；鞈�(zhàn)：百度文心大模型已進(jìn)化至3.5形態(tài);阿里通義千問構(gòu)建家族模式;京東言犀大模型則是為自己“量身定做”的產(chǎn)業(yè)大模型;美團(tuán)牽手清華系，領(lǐng)投AI公司智譜華章;360智腦將接入“360全家桶”……

　　大廠大模型進(jìn)化論，殘酷又現(xiàn)實(shí)，要么趕超，要么被淘汰。

　　搶跑且不�？炭嘤�(xùn)練的百度文心大模型3.5，近日宣稱最新版本文心一言能力已經(jīng)超出ChatGPT 3.5。

　　物競(jìng)天擇，適者生存，大廠大模型紛紛趕超ChatGPT。

　　01 大廠大模型，超過ChatGPT3.5

　　身穿黑色內(nèi)搭外穿白色西服外套，搭配干凈利落的短發(fā)，出現(xiàn)在AI大模型技術(shù)能力評(píng)估報(bào)告大會(huì)上。

　　前一天晚上還在修改議題，剛剛出差回來的百度集團(tuán)副總裁吳甜在會(huì)上說到：“新版本文心一言能力已經(jīng)超出ChatGPT 3.5，這也是在我們國內(nèi)開展相關(guān)技術(shù)工作是重要的里程碑。”

　　這是繼科大訊飛劉慶峰提到星火大模型即將趕超ChatGPT后，又一家大廠正式確認(rèn)大模型超過ChatGPT。

　　今年3月，百度新一代知識(shí)增強(qiáng)大語言模型“文心一言”公開邀測(cè)，該模型基于文心大模型3.0版本打造。時(shí)隔3個(gè)多月，已經(jīng)升級(jí)為3.5版本的文心大模型，在效果、功能、性能全面提升。

　　文心一言3.5趕超ChatGPT3.5，很大可能是在功能方面新增了插件機(jī)制，文心大模型3.5通過插件方式擴(kuò)增了大模型的能力邊界。

　　大模型強(qiáng)調(diào)大模型技術(shù)實(shí)力和底座能力。今年5月份，百度上線的新底座大模型正是文心大模型3.5，該模型是文心一言系統(tǒng)的基礎(chǔ)模型，給了文心大模型扎實(shí)的底座基礎(chǔ)，也讓文心一言3.5成功趕超ChatGPT。

　　值得一提的是，在基礎(chǔ)模型訓(xùn)練中，3.5版本還采用了飛槳*進(jìn)的自適應(yīng)混合并行訓(xùn)練技術(shù)及混合精度計(jì)算策略，這大大加快了模型的迭代速度。

　　眾所周知，百度一直在深耕全棧式人工智能技術(shù)研發(fā)，共四層：芯片層、框架層、模型層和應(yīng)用層。

　　芯片層有昆侖芯;框架層有深度學(xué)習(xí)平臺(tái)飛槳，有力支撐了大模型的高效訓(xùn)練和推理;模型層有文心大模型;在應(yīng)用層，目前有15萬家企業(yè)申請(qǐng)接入文心一言測(cè)試。

　　其中，飛槳平臺(tái)已經(jīng)有750萬開發(fā)者，對(duì)比中國軟件從業(yè)人員800萬—1000萬，盡管軟件從業(yè)人員和深度學(xué)習(xí)開發(fā)人員不完全一致，但在人才數(shù)量上的優(yōu)勢(shì)也為文心3.5趕超ChatGPT提供了大容量智庫，類似超腦的存在。

　　中國企業(yè)在獲得中文語料和對(duì)中國文化的理解方面，相較于外國企業(yè)本來就有著天然的優(yōu)勢(shì)，中國制造業(yè)門類最全，具有面向?qū)嶓w產(chǎn)業(yè)訓(xùn)練產(chǎn)業(yè)AIGC的有利條件。

　　眾多因素合力助推，文心大模型3.0為基座的文心一言發(fā)布一百多天后，在飛槳與文心的協(xié)同優(yōu)化下，文心大模型3.5成長飛速，最新模型效果提升50%，訓(xùn)練速度提升2倍，推理速度提升30倍，成功趕超ChatGPT。

　　在基礎(chǔ)技術(shù)之上，百度額外開展了三大增強(qiáng)技術(shù)：知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)。

　　將大模型類比成人類，人如果用知識(shí)結(jié)構(gòu)，知識(shí)體系的方式進(jìn)行學(xué)習(xí)的話，學(xué)習(xí)效率更高。再學(xué)會(huì)使用工具進(jìn)行搜索，實(shí)現(xiàn)端對(duì)端的極簡(jiǎn)化檢索，又可以提升時(shí)效性。

　　大模型自己學(xué)習(xí)完之后，還得學(xué)會(huì)反饋式強(qiáng)化訓(xùn)練，對(duì)話增強(qiáng)很像是不斷讓大模型在做題，在對(duì)話中告訴大模型哪里對(duì)，哪里不對(duì)，通過提示的方式，讓大模型能夠增強(qiáng)記憶機(jī)制，有效的讓他按照我們希望的方式來回答問題，教會(huì)這個(gè)孩子怎么樣回答的更好。

　　除了技術(shù)實(shí)力，大模型需要落地。

　　在行業(yè)應(yīng)用方面，百度文心大模型源于產(chǎn)業(yè)實(shí)踐，服務(wù)于產(chǎn)業(yè)實(shí)踐，已經(jīng)摸索出大模型產(chǎn)業(yè)落地的關(guān)鍵路徑，還發(fā)布了涵蓋眾多行業(yè)和領(lǐng)域的大模型，加速對(duì)行業(yè)智能化轉(zhuǎn)型。

　　目前，國家電網(wǎng)、浦發(fā)、泰康、吉利、哈爾濱市、深圳燃?xì)�、TCL等企業(yè)單位，百度文心大模型均有合作。

　　此外，百度十年來研發(fā)投入超1000億，2021年核心研發(fā)投入占比超23%，人工智能專業(yè)申請(qǐng)量和授權(quán)量連續(xù)5年排名國內(nèi)*，深度學(xué)習(xí)專利申請(qǐng)量全球*。百度能在AI大模型領(lǐng)域有突破，與百度在要素資源上的大力投入也息息相關(guān)。

　　可以看出，大廠大模式，拼研發(fā)的時(shí)刻到了。

　　02 大廠大模型哪家強(qiáng)？

　　今年上半年正式公開宣布做大模型的企業(yè)就有近百家，各家大模型正陷入酣戰(zhàn)。其中，有阿里、百度、騰訊、京東、字節(jié)跳動(dòng)等互聯(lián)網(wǎng)大廠玩家，也有科大訊飛、商湯科技等AI公司，還有其他“雜牌軍”也混入其中。

　　半年時(shí)間，大模型賽道完成了從概念到落地的進(jìn)程，這放在任何賽道都很炸裂。

　　但是，到目前為止，都沒有明確的指標(biāo)或者準(zhǔn)則去驗(yàn)證誰家的大模型更優(yōu)質(zhì)，一個(gè)接著一個(gè)發(fā)布會(huì)，“王婆賣瓜自賣自夸”式的自我評(píng)價(jià)，令人眼花繚亂之余，并沒有太多客觀性。

　　那么，百模大戰(zhàn)，究竟誰更勝一籌?

　　在IDC最新發(fā)布的《AI大模型技術(shù)能力評(píng)估報(bào)告，2023》中，首次提出AI大模型技術(shù)能力評(píng)估框架。

　　評(píng)估大模型共有三大維度：產(chǎn)品技術(shù)、服務(wù)生態(tài)、行業(yè)應(yīng)用。

　　具體細(xì)分指標(biāo)可達(dá)12個(gè)：算法模型、服務(wù)能力、通用能力、創(chuàng)新能力、平臺(tái)能力、安全可解釋、生態(tài)合作、行業(yè)覆蓋、金融、工業(yè)、醫(yī)療、能源。

　　其中，算法模型和行業(yè)覆蓋，是衡量大模型能力最重要的2個(gè)指標(biāo)，特別是，二者可以形成持續(xù)迭代提升的飛輪。

　　產(chǎn)品技術(shù)能力中，“算法模型”維度是大模型能力最為核心的要素，也是決定大模型應(yīng)用效果的根本所在。

　　原因在于，只有通過算法模型技術(shù)的突破，實(shí)現(xiàn)具有通用效果優(yōu)勢(shì)的大模型底座，才能支撐更廣泛的行業(yè)覆蓋，使各行各業(yè)充分享受技術(shù)突破帶來的紅利，破解AI落地門檻高的困境。

　　行業(yè)應(yīng)用能力中，應(yīng)用覆蓋的廣度是當(dāng)下大模型廠商最為關(guān)注的指標(biāo)，是大模型效果通用*性、行業(yè)結(jié)合能力的綜合體現(xiàn)。

　　所以，“行業(yè)覆蓋”通過企業(yè)級(jí)客戶數(shù)量和落地行業(yè)數(shù)，體現(xiàn)了大模型在產(chǎn)業(yè)落地上的實(shí)力。

　　國內(nèi)主流大模型，包括百度、阿里、騰訊、華為、科大訊飛、360、商湯、第四范式等14家廠商參與了本次評(píng)估。

　　大廠大模型的競(jìng)爭(zhēng)咬合度很高，百度特點(diǎn)具有“芯片-框架-模型-應(yīng)用”四層技術(shù)棧完整布局的獨(dú)特優(yōu)勢(shì)：芯片層-昆侖芯、框架層-飛槳、模型層-文心大模型，以及各種AI的落地應(yīng)用，其中百度自研的深度學(xué)習(xí)平臺(tái)飛槳在大模型的高效訓(xùn)練和推理上提供了強(qiáng)有力的支撐。

　　阿里云，也很亮眼，12項(xiàng)指標(biāo)獲得6項(xiàng)滿分，且是*獲得“服務(wù)能力”滿分的廠商。作為基礎(chǔ)模型提供方，大模型廠商的平臺(tái)能力、服務(wù)能力和生態(tài)合作水平對(duì)行業(yè)發(fā)展至為重要。阿里云在這三個(gè)指標(biāo)上都獲得了滿分。

　　目前，阿里云的通義大模型家族現(xiàn)已具備處理或生成文本、語音和圖片等多種模態(tài)的能力。過去3個(gè)月，阿里云先后推出了基礎(chǔ)模型“通義千問”、音視頻大模型產(chǎn)品“通義聽悟”、 AI繪畫創(chuàng)作大模型“通義萬相”，通義大模型家族仍在不斷迭代和進(jìn)化中。

　　同為互聯(lián)網(wǎng)大廠的騰訊云和京東云，都選擇根據(jù)自身特色，深耕產(chǎn)業(yè)側(cè)，發(fā)布行業(yè)大模型。

　　騰訊云在構(gòu)建行業(yè)大模型的基礎(chǔ)上，用自身數(shù)據(jù)進(jìn)行微調(diào)，打造出數(shù)據(jù)精準(zhǔn)性更高、隱私安全性更強(qiáng)的專屬模型。

　　對(duì)于深耕數(shù)年供應(yīng)鏈的京東來說，長期扎根于電商業(yè)務(wù)和物流業(yè)務(wù)，選擇奔向產(chǎn)業(yè)大模型，專注于供應(yīng)鏈?zhǔn)歉玫倪x擇。正如京東在言犀大模型發(fā)布會(huì)上所言，“只有將供應(yīng)鏈做實(shí)，才能將大模型做實(shí)”。

　　科大訊飛等AI廠家在垂直賽道也拿到了滿分，這些玩家在做透垂直行業(yè)上有機(jī)會(huì)，在廠商競(jìng)爭(zhēng)中，垂直領(lǐng)域優(yōu)勢(shì)明顯企業(yè)將*。

　　以科大訊飛為例，科大訊飛專注人工智能領(lǐng)域20多年，多項(xiàng)核心技術(shù)均處于國際*水平，星火大模型將大模型的語言理解能力、概括表達(dá)能力結(jié)合類搜索插件，有效解決了新知識(shí)難以更新、事實(shí)類問答容易“張冠李戴”等行業(yè)難題，實(shí)現(xiàn)了知識(shí)問答能力相比原來24%的提升。

　　由于訓(xùn)練大模型的成本極高，普通開發(fā)者和中小企業(yè)無從下手，這從報(bào)告結(jié)果也能看出：其他廠也很努力，但前途漫漫，說得更殘酷些，可能連上桌吃飯的機(jī)會(huì)都少有。

　　03 大模型，未來通往何方？

　　在前不久的WAIC大會(huì)上，入場(chǎng)大模型的玩家們其實(shí)已經(jīng)劃出了重點(diǎn)：首先解決技術(shù)問題，再是場(chǎng)景落地，最后實(shí)現(xiàn)商業(yè)與規(guī)�；�。

　　目前，我們看到大模型已經(jīng)開始與場(chǎng)景、行業(yè)進(jìn)行深度融合，例如，代碼生成、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)等領(lǐng)域的大模型，驗(yàn)證了大模型已不僅在科技企業(yè)中應(yīng)用，也邁出了走向各行各業(yè)的步伐。

　　國內(nèi)大模型飛快躍過大模型概念股階段，AI大模型已經(jīng)從拼參數(shù)發(fā)展到拼應(yīng)用。

　　比如，華為盤古大模型已經(jīng)在氣象、醫(yī)藥研發(fā)、電力、語種等領(lǐng)域落地，并交付了多個(gè)千億參數(shù)大模型。騰訊云行業(yè)大模型能力將應(yīng)用到金融風(fēng)控、交互翻譯、數(shù)智人客服等場(chǎng)景中，提升了智能應(yīng)用效率，一站式MaaS服務(wù)為企業(yè)減負(fù)。

　　具體到應(yīng)用場(chǎng)景，以金融領(lǐng)域?yàn)槔�，行業(yè)大模型可以加持金融風(fēng)控解決方案，相比之前有了10倍效率提升。

　　大模型結(jié)合過往積累的多年黑灰產(chǎn)對(duì)抗經(jīng)驗(yàn)和上千個(gè)真實(shí)業(yè)務(wù)場(chǎng)景，整體反欺詐效果相較于傳統(tǒng)模式，提升了20%左右。企業(yè)則可以基于prompt模式，迭代風(fēng)控能力，從樣本收集、模型訓(xùn)練到部署上線，實(shí)現(xiàn)全流程零人工參與，建模時(shí)間也從2周減少到僅需2天。

　　即便樣本積累有限的情況下，也可以完成快速搭建，跳過“冷啟動(dòng)”過程。

　　如何落地及商業(yè)化，正在成為廠商追求的重點(diǎn)。

　　這意味著，AI進(jìn)入大規(guī)�？蓮�(fù)制的產(chǎn)業(yè)落地階段，僅利用下游的小樣本或者零樣本學(xué)習(xí)就可以達(dá)到很好的效果，從而降低AI開發(fā)成本。百度文心大模型在升級(jí)后，就成功將成本降至過去的10%。

　　任何行業(yè)，最終都會(huì)形成寡頭態(tài)勢(shì)，大模型也不例外。

　　過去短短幾個(gè)月，大量新的大模型涌現(xiàn)，是瘋狂想抓住風(fēng)口，害怕掉隊(duì)，還是長遠(yuǎn)布局賽道，潛心鉆研，每位玩家只有自己心知肚明。

　　百�；鞈�(zhàn)只會(huì)是一個(gè)階段性的現(xiàn)象，終局仍然集中在少量的幾個(gè)大模型。原因不外乎以下幾點(diǎn)：

　　一是，在演變過程中，各企業(yè)和機(jī)構(gòu)逐漸找到了自己的定位，逐漸走向細(xì)分方向，最終被更完善的大模型收入麾下。

　　二是，需要多年積累。真正從底層做起來的大模型，成本非常高，需要非常綜合的能力，在心態(tài)上也必須抱有*的長期主義，這就意味著沒有*經(jīng)濟(jì)實(shí)力的玩家，會(huì)被甩在半路或者“死”在通往光明的路上。

　　三是，大模型在應(yīng)用層面未來想象空間非常大。假設(shè)每一個(gè)行業(yè)都有巨大的發(fā)展空間，可以通過新AI技術(shù)提效，應(yīng)用層面的價(jià)值一定會(huì)分流，依托幾個(gè)頭部大模型會(huì)有非常廣泛的應(yīng)用生態(tài)。

　　不可否認(rèn)的是，未來所有的企業(yè)都會(huì)強(qiáng)依賴大模型，所有的產(chǎn)品都會(huì)基于大模型來開發(fā)。

　　而行業(yè)滲透率和市場(chǎng)份額，儼然成為企業(yè)大模型走向寡頭最重要的挑戰(zhàn)元素。

　　榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報(bào)生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

免费观看已满十八岁电视剧国语_人妻色综合网站_欧美大尺寸suv视频_成人免费高清在线观看_久久久成人毛片无码_老头解开奶罩吸奶头高潮视频_sm调教室论坛入口_欧美夫妻交换久久丫1000_一级黄色大片在线免费观看了

大廠趕超ChatGPT

最新新聞

熱門新聞

新動(dòng)態(tài)

關(guān)注度

最話題

免费观看已满十八岁电视剧国语_人妻 色综合网站_欧美大尺寸suv视频_成人免费高清在线观看_久久久成人毛片无码_老头解开奶罩吸奶头高潮视频_sm调教室论坛入口_欧美夫妻交换久久丫1000_一级黄色大片在线免费观看了

大廠趕超ChatGPT

相關(guān)閱讀

最新新聞

熱門新聞

新動(dòng)態(tài)

關(guān)注度

最話題

免费观看已满十八岁电视剧国语_人妻色综合网站_欧美大尺寸suv视频_成人免费高清在线观看_久久久成人毛片无码_老头解开奶罩吸奶头高潮视频_sm调教室论坛入口_欧美夫妻交换久久丫1000_一级黄色大片在线免费观看了