我有一個好想法,就差一個 AI 了
今天我特別想跟大家分享一下,人工智能產(chǎn)品在「演進」上的一些體會。
人工智能產(chǎn)品一個核心特點就是「演進」。也就是說「你很難一下子達到那個地方」,這可能是與傳統(tǒng)的互聯(lián)網(wǎng)產(chǎn)品很不一樣的地方。
互聯(lián)網(wǎng)已經(jīng)存在很多年了,在產(chǎn)品經(jīng)理的人才積累上大概已經(jīng)過 10 萬的數(shù)量級了吧。對比國內(nèi)人工智能的導(dǎo)師儲備也不過數(shù)百人,國內(nèi)人工智能相關(guān)專業(yè)出來的研究生可以估算不會太多。這里面又有多少會成為人工智能工程師呢?而人工智能產(chǎn)品經(jīng)理就更少了。
所以,在中國現(xiàn)在做人工智能的產(chǎn)品,跟我們以前做互聯(lián)網(wǎng)的產(chǎn)品很不一樣。單從人才供給來說,無論是產(chǎn)品經(jīng)理、工程師,還是往上一層的架構(gòu)層面的人,都只是傳統(tǒng)互聯(lián)網(wǎng) 1/10 到 1/100 這樣的數(shù)量級。
工程領(lǐng)域有一個原則,任何系統(tǒng)的架構(gòu)你設(shè)計得再好,當系統(tǒng)面對的問題規(guī)模的數(shù)量級上升,或者下降,這個架構(gòu)就會出問題。那么,我們互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)上的產(chǎn)品設(shè)計經(jīng)驗是為過去的規(guī)模的問題所設(shè)計的,我們現(xiàn)在碰到了新問題,還可以用原來的方法來做嗎?我覺得肯定是不一樣的。今天就來探討幾個不一樣的地方。
現(xiàn)在很多人在談這種焦慮感——人工智能要顛覆這個、要顛覆那個。我昨天看到微軟 AI 負責人沈向陽老師在說計算機視覺識別系統(tǒng)要在 10 年之內(nèi)識別所有的東西。過去我們常說「我有一個好想法,就缺一個程序員/產(chǎn)品經(jīng)理了」,今年大家都改口「我的想法就缺 AI 了」。
但人工智能對社會的顛覆其實還沒有發(fā)生,并且這個顛覆也是沒那么容易發(fā)生的。因為人工智能的資源是很稀缺的。稀缺資源造成現(xiàn)在組建一個人工智能團隊,就一個字——「貴」。現(xiàn)在一個北清畢業(yè)的博士的入門價格 BAT 能給他開到 60萬*。過去我有看過其他人的團隊預(yù)算,十個人的機器學(xué)習團隊,初期需要投入上千萬。由于人才的稀缺,決定了這個風險不但來自于業(yè)務(wù)更來自于團隊本身,少了任何一個人都很填上這個坑。(編者注:具體數(shù)字有待考據(jù))
理解人工智能的局限性
其實,目前的 AI 技術(shù)并不是那么靠譜,還是不成熟的。人工智能已經(jīng)經(jīng)歷了兩次大型 AI 寒冬了,小的冬天不計其數(shù),我就經(jīng)歷過其中兩次小寒冬(神經(jīng)網(wǎng)絡(luò)和語義網(wǎng))。這次的熱潮還會不會有冬天?有人說不會,但我已經(jīng)被咬兩次了,我不敢這么樂觀。
因為人工智能現(xiàn)在還是“人工智障 ”的成分居多。我們做產(chǎn)品,更多是從人工智障開始做的。
2000 年,我在MIT研究期間的導(dǎo)師 Tim Berners-Lee(注:英國計算機科學(xué)家、萬維網(wǎng)的發(fā)明者,南安普頓大學(xué)與 MIT 教授) 曾告訴大家,未來會是語義網(wǎng)的。當時實驗室成果讓大家很樂觀地認為可能 10 年之內(nèi)就能在消費者領(lǐng)域?qū)崿F(xiàn)語義網(wǎng)。2001 年他在 《科學(xué)美國人》相關(guān)領(lǐng)域中的描述的產(chǎn)品就很像是 Siri,但當我們做了 10 年以后,我們發(fā)現(xiàn)我們遠遠低估了這個開發(fā)難度�,F(xiàn)在 16 年過去了,我們還是沒有達到他描述的對話機器人的技術(shù)水準。
編者注:語義網(wǎng)是對未來網(wǎng)絡(luò)的一個設(shè)想,現(xiàn)在與 Web 3.0 這一概念結(jié)合在一起,作為 3.0 網(wǎng)絡(luò)時代的特征之一。簡單地說,語義網(wǎng)是一種智能網(wǎng)絡(luò),它不但能夠理解詞語和概念,而且還能夠理解它們之間的邏輯關(guān)系,可以使交流變得更有效率和價值。語義網(wǎng)核心是:通過給萬維網(wǎng)上的文檔 (如:HTML文檔、XML文檔)添加能夠被計算機所理解的語義「元數(shù)據(jù)」(外語:Meta data),從而使整個互聯(lián)網(wǎng)成為一個通用的信息交換媒介。
所以,我們今天看到的很多的事情,比如知識圖譜、深度學(xué)習,從一開始的一個想法,到工程上、到產(chǎn)品上,最后落地到商業(yè)上是一個很漫長的歷程,通常需要 30 到 40 年。所以當我們看到一些實驗性的成果,我們應(yīng)該把自己的興奮壓一壓,因為這中間有很多不靠譜的坑。
人工智能的技術(shù)瓶頸不是要代替智人作為動物的那一部分,而在于代替我們最近幾千年發(fā)展起來的那些認知能力,也就是我們有了符號思維能力之后的智能。在學(xué)術(shù)上體現(xiàn)在,深度學(xué)習這種算法在不同領(lǐng)域上起到的改變是不一樣的,它可以讓語音和圖像的識別能力前進了一大步,但是在自然語言處理或是知識圖譜這方面的提高只有 1-2%。比如說,假設(shè)傳統(tǒng)的自然語言分詞算法可以達到 88% 的正確率,那么深度學(xué)習算法在準確率上可能做到 89-90%。但是深度學(xué)習可以把視覺識別的準確率提升了 10-20%。
為什么會有這種區(qū)別呢?
原因是「識別」這件事情是哺乳動物的智能,不僅僅限于人類。你家的小貓小狗會識別出你跟別人不一樣。深度學(xué)習可以在這種自然能力的處理上有很不錯的表現(xiàn)。但是語言和文字這種符號思考能力是近幾千年歷史上發(fā)展出來的,跟傳統(tǒng)的信號處理能力非常不一樣。
所以,現(xiàn)在的算法是有局限性的,我們在構(gòu)建人工智能系統(tǒng)的時候要理解它的局限性。
關(guān)注路徑,而非直奔目標
移動時代互聯(lián)網(wǎng)產(chǎn)品經(jīng)理培養(yǎng)的直覺是:剛需、極致。但是在人工智能領(lǐng)域,這樣直奔主題的直覺未必能成功。人工智能產(chǎn)品由于其復(fù)雜性,其設(shè)計核心是其中間路徑而非最終目標。
我們移動互聯(lián)網(wǎng)時代在制定項目的時候,常會先有一個明確的目標。但是怎么完成一個項目不是由目標所決定的,是路徑?jīng)Q定的。
一群老鼠開會要做風控,貓來抓老鼠之前做一個預(yù)警。怎么做呢?大家定了一個明確的目標,在貓脖子上系鈴鐺。問題是,哪只老鼠來做這件事呢?怎么做呢?
這就是路徑。
路徑有很多層含義。
別人的目標不是你應(yīng)該效仿的終點,別人的路徑更不是你要效仿的路徑。BAT 的終點不是你的終點。我剛開始創(chuàng)業(yè)的時候,特別喜歡看別的架構(gòu)師的那些架構(gòu),認真地做筆記,但當我開始認真搭建自己項目的架構(gòu)時,我還是不知道這個邏輯是什么,為什么這么搭。因為整個項目的演進過程中,最重要的事情不是最終公布出來的那些,而是沒有被公布出來的。你最終學(xué)習到的都是一些切片,無論是他的終點、還是所謂的路徑,其實都是他 90% 預(yù)想的路徑被否定之后的一些切片。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...