過去22個月,AI發(fā)展速度超過任何歷史時期,但我們依然還處于AGI變革的早期。

吳泳銘:AI最大的想象力不在手機屏幕,而是改變物理世界

2024-09-19 15:28:59發(fā)布     來源:阿里云    作者:阿里云  

  多知9月19日消息,阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事長兼CEO吳泳銘在2024云棲大會上發(fā)表主題演講。他認(rèn)為過去22個月,AI發(fā)展速度超過任何歷史時期,但我們依然還處于AGI變革的早期。生成式AI最大的想象力,絕不是在手機屏幕上做一兩個新的超級app,而是接管數(shù)字世界,改變物理世界。

  以下為演講全文:

  歡迎來到2024云棲大會。在剛剛過去的夏天,阿里云全面支撐巴黎奧運會實現(xiàn)了歷史性突破,云計算首次超越衛(wèi)星,成為奧運主要轉(zhuǎn)播方式。AI也首次廣泛應(yīng)用于奧運會。今天,云棲大會的焦點也是AI。我主要分享三點內(nèi)容:

  第一,過去22個月,AI發(fā)展的速度超過任何歷史時期,但我們現(xiàn)在依然還處于AGI變革的早期階段。

  大模型技術(shù)快速迭代,技術(shù)可用性大幅提升。大模型已經(jīng)具備了文本、語音、視覺的多模態(tài)能力,能夠開始完成復(fù)雜指令。去年,大模型還只能幫助程序員寫簡單的代碼,今天已經(jīng)能直接理解需求,完成復(fù)雜的編程任務(wù)。去年,大模型的數(shù)學(xué)能力還只有中學(xué)生水平,今天已達(dá)到國際奧賽金牌水平,并在物理、化學(xué)、生物等多方面學(xué)科接近博士水平。

  同時,模型推理成本指數(shù)級下降,已經(jīng)遠(yuǎn)遠(yuǎn)超過摩爾定律。一年來,通義千問API在阿里云百煉上的調(diào)用價格下降了97%,百萬Tokens調(diào)用花費最低已經(jīng)降到了5毛錢。推理成本是應(yīng)用爆發(fā)的關(guān)鍵問題,阿里云會努力把成本繼續(xù)降下去。

  開源生態(tài)蓬勃發(fā)展。今年6月,通義千問開源Qwen2,迅速登頂Huggingface的全球開源模型排行榜。在Huggingface上,Qwen的原生和衍生模型接近5萬個,排名全球第二。阿里云魔搭社區(qū)上有超過1萬個模型、服務(wù)了超過690萬開發(fā)者。

  這一切才剛剛開始,要實現(xiàn)真正的AGI,下一代模型需要具備更大規(guī)模、更通用、更泛化的知識體系,同時也將具備更復(fù)雜更多層次的邏輯推理能力。全世界先進(jìn)模型競爭的投入門檻,將達(dá)到數(shù)十億、數(shù)百億美金的級別。AI具備創(chuàng)造能力、幫助人類解決復(fù)雜問題的路徑清晰可見,也打開了AI在各行業(yè)場景中廣泛應(yīng)用的可能性。

  第二,AI最大的想象力不在手機屏幕,而是接管數(shù)字世界,改變物理世界。

  今天很多行業(yè)內(nèi)人士一直在想AI最大的應(yīng)用是什么,可能一直在想手機上有什么AI時代創(chuàng)新的超級APP。但我們認(rèn)為AI最大的想象力絕對不是在手機屏幕上,AI最大的想象力是在通過滲透數(shù)字世界、接管數(shù)字世界,并改變物理世界,這才是AI最大的想象力。

  我們不能只停在移動互聯(lián)網(wǎng)的視角看未來。生成式AI最大的想象力,絕不是在手機屏幕上做一兩個新的超級app,而是接管數(shù)字世界,改變物理世界。

  過去三十年,互聯(lián)網(wǎng)浪潮的本質(zhì)是連接,互聯(lián)網(wǎng)連接了人、信息、商業(yè)和工廠,通過連接提高了世界的協(xié)作效率,創(chuàng)造了巨大的價值,改變了人們的生活方式。但生成式AI是通過生產(chǎn)力的供給創(chuàng)造了新的價值,從而為世界創(chuàng)造了更大的內(nèi)在價值,也就是總體提高了整個世界的生產(chǎn)力水平。這種價值創(chuàng)造,可能是移動互聯(lián)網(wǎng)連接價值的十倍、幾十倍。

  我們認(rèn)為生成式AI將逐漸滲透數(shù)字世界,并接管數(shù)字世界,物理世界的大部分事物都會具備AI能力,形成下一代的具備AI能力的全新產(chǎn)品,并與云端AI驅(qū)動的數(shù)字世界連接產(chǎn)生協(xié)同效應(yīng)。

  很長一段時間,AI的焦點主要集中在模擬人類的感知能力,比如自然語言理解、語音識別、視覺識別。但是生成式AI的崛起,帶來了質(zhì)的飛躍,AI不再僅僅局限于感知,而是首次展現(xiàn)了思考推理和創(chuàng)造的力量。

  生成式AI讓世界有了一個統(tǒng)一的語言——Token。它可以是任何文字、代碼、圖像、視頻、聲音,或者是人類千百年來的思考。AI模型可以通過對物理世界數(shù)據(jù)的Token化,理解真實世界的方方面面,比如人類行走、奔跑、駕駛車輛、使用工具,繪畫、作曲、寫作、表達(dá)、教學(xué)、編程的技巧,甚至是開公司創(chuàng)業(yè)。理解之后,AI就可以模仿人類去執(zhí)行物理世界的任務(wù)。這將帶來新的產(chǎn)業(yè)革命。

  我們看到,汽車行業(yè)正在發(fā)生這樣的變革。之前的自動駕駛技術(shù),是靠人來寫算法規(guī)則,幾十萬行代碼,仍然無法窮盡所有的駕駛場景。采用“端到端”的大模型技術(shù)訓(xùn)練后,AI模型直接學(xué)習(xí)海量人類駕駛視覺數(shù)據(jù),讓汽車具備了超越大部分司機的駕駛能力。

  機器人將是下一個迎來巨變的行業(yè)。未來,所有能移動的物體都會變成智能機器人。它可以是工廠里的機械臂、工地里的起重機、倉庫里的搬運工、救火現(xiàn)場的消防員、包括家庭里的寵物狗、保姆、助理。

  未來,工廠里會有很多機器人,在AI大模型的指揮下,生產(chǎn)機器人。現(xiàn)在每個城市家庭里有一輛或者兩輛車,未來每個家庭可能會有兩三個機器人,幫助人們提升生活當(dāng)中的效率。

  可以想見,AI驅(qū)動的數(shù)字世界連接著具備AI能力的物理世界,將會大幅提升整個世界的生產(chǎn)力,對物理世界的運行效率產(chǎn)生革命性的影響。

  第三,AI計算正在加速演進(jìn),成為計算體系的主導(dǎo)。

  無論是我們看到端側(cè)的計算,還是云端的世界,這都是一個非常明顯的趨勢。生成式AI對數(shù)字世界和物理世界的重構(gòu),將帶來計算架構(gòu)的根本性變化。過去幾十年,CPU主導(dǎo)的計算體系,正在加速向GPU主導(dǎo)的AI計算體系轉(zhuǎn)移。未來幾乎所有的軟硬件都會具備推理能力,它們的計算內(nèi)核將變成GPU AI算力為主、CPU傳統(tǒng)計算為輔的計算模式。

  我們看到,在新增算力市場上,超過50%的新需求由AI驅(qū)動產(chǎn)生,AI算力需求已經(jīng)占據(jù)主流地位。這一趨勢還會持續(xù)擴(kuò)大。過去一年,阿里云投資新建了大量的AI算力,但還是遠(yuǎn)遠(yuǎn)不能滿足客戶的旺盛需求。

  今天我們接觸到的所有客戶、所有開發(fā)者、所有CTO,幾乎都在用AI重構(gòu)自己的產(chǎn)品。大量新增需求正在由GPU算力驅(qū)動,大量存量應(yīng)用也在用GPU重新改寫。在汽車、生物醫(yī)藥、工業(yè)仿真、氣象預(yù)測、教育、企業(yè)軟件、移動APP、游戲等行業(yè),AI計算正在加速滲透。在各行各業(yè),看不見的新產(chǎn)業(yè)革命正在悄然演進(jìn)。

  所有行業(yè),都需要性能更強、規(guī)模更大、更適應(yīng)AI需求的基礎(chǔ)設(shè)施。

  阿里云正在以前所未有的強度投入AI技術(shù)研發(fā)和基礎(chǔ)設(shè)施建設(shè)。我們的單網(wǎng)絡(luò)集群已拓展至十萬卡級別,正在從芯片、服務(wù)器、網(wǎng)絡(luò)、存儲到散熱、供電、數(shù)據(jù)中心等方方面面,重新打造面向未來的AI先進(jìn)基礎(chǔ)設(shè)施。

  從歷史經(jīng)驗來看,人們對新技術(shù)革命,往往對短期高估,又對長期低估。因為在新技術(shù)應(yīng)用早期,滲透率還比較低,人們經(jīng)驗沒有發(fā)生過此類事件,大部分人的本能會產(chǎn)生懷疑,這很正常。但新技術(shù)革命會在人們的懷疑中成長,讓很多人在遲疑中錯過。

  站在AI時代浪潮的開端,我感到無比興奮。今天,我們請到大模型、自動駕駛和機器人三個領(lǐng)域的企業(yè)家和科學(xué)家。他們正在飛奔著用AI重構(gòu)我們的世界,期待他們的精彩分享。

  謝謝大家。希望大家度過一個充實、愉快的云棲。