7月7日消息,在2023世界人工智能大會(huì)(WAIC)啟明創(chuàng)投論壇“生成式AI與大模型:變革與創(chuàng)新”上,啟明創(chuàng)投攜手未盡研究,共同發(fā)布報(bào)告《生成式AI》| State of Generative AI 2023。
2022年和2023年,是生成式人工智能技術(shù)取得突破的兩年,過去半年最重要的研究方向,是破解和理解大模型神秘而又令人興奮的智能“涌現(xiàn)”。大模型既需要超越對(duì)下一個(gè)詞的預(yù)測(cè)能力,也需要一個(gè)更豐富、更復(fù)雜的“慢思考”深層機(jī)制,來監(jiān)督“快思考”預(yù)測(cè)下一個(gè)詞的機(jī)制。長期來看,人才對(duì)人工智能未來的影響,超過了算力。
基于研究,報(bào)告對(duì)未來一至三年的大語言模型、多模態(tài)模型和商業(yè)競(jìng)爭(zhēng)態(tài)勢(shì),做出了十點(diǎn)前瞻:
大語言模型
1. 2024年中國將出現(xiàn)比肩GPT-4的多語言通用大模型;
2. 超長上下文(Long Context)將引領(lǐng)下一次LLM技術(shù)突破;
3. 在出現(xiàn)更有前景的大語言模型之前,為實(shí)現(xiàn)垂直領(lǐng)域更好的效果,以下三種方式將共存:
I)在不改變數(shù)據(jù)分布的情況下,利用更多通用數(shù)據(jù)進(jìn)行通用大模型預(yù)訓(xùn)練,不特別引入行業(yè)數(shù)據(jù),
ii)利用行業(yè)專屬數(shù)據(jù)微調(diào)(Fine-Tuning)通用大模型,
iii)利用行業(yè)數(shù)據(jù)占比更高的數(shù)據(jù)集進(jìn)行垂直模型預(yù)訓(xùn)練。
多模態(tài)模型
4. 當(dāng)前CLIP + Diffusion的文生圖模型是過渡態(tài),未來2年內(nèi)將出現(xiàn)一體化的模型結(jié)構(gòu);
5. 下一代Text-to-Image模型將具備更強(qiáng)的可控性,它將結(jié)合底層模型能力和前端控制方式,對(duì)模型的設(shè)計(jì)將注重與控制方式的結(jié)合;
6. 2025年之前,Video和3D等模態(tài)將迎來里程碑式的模型,大幅提高生成效果;
7. 以PALM-E為代表的具身智能(Embodied AI)展現(xiàn)出在機(jī)器人的感知、理解和決策等方向上的巨大潛力,但當(dāng)前訓(xùn)練和可靠性存在較大挑戰(zhàn);
8. 短期內(nèi)Transformer正成為多個(gè)模態(tài)的主流網(wǎng)絡(luò)結(jié)構(gòu),但壓縮整個(gè)數(shù)字世界的通用方法尚未出現(xiàn),Transformer并不是人工智能技術(shù)的終點(diǎn)。
商業(yè)機(jī)會(huì)
9. 3年內(nèi),顛覆式的AI應(yīng)用的核心驅(qū)動(dòng)力來自于底層模型的創(chuàng)新,兩者無法解耦,模型的作用將大于產(chǎn)品設(shè)計(jì)的作用;
10. 當(dāng)前生成式AI市場(chǎng)處于技術(shù)主導(dǎo)的早期階段,存在千億美元市值的平臺(tái)性企業(yè)的機(jī)會(huì)。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...