大模型輪番登場,上海打響“百模”大戰(zhàn)。加快建設更具國際影響力的人工智能高地,上海如何讓算力“即取即用”?東方衛(wèi)視《今晚》特別欄目“看懂上海”邀請上海市人工智能標準化技術委員會副秘書長、上海人工智能行業(yè)協(xié)會標準研究部部長陳曦、臨港新片區(qū)管委會數(shù)據(jù)處副處長倪曉杰,以及上海星云愛店科技有限公司首席技術官董繼明,一起討論。
“百模”大戰(zhàn)打響 大家在“卷”什么?
當ChatGPT、Sora等AI大模型驚艷亮相,改變人類的生產(chǎn)生活、認知思維方式時,一批國產(chǎn)大模型正敲響戰(zhàn)鼓、迎頭趕上。最近,上海接連“上新”了一批大模型,“百模大戰(zhàn)”愈加激烈。
4月23日,商湯科技發(fā)布新一代大模型,其知識、推理、數(shù)學、代碼等指標與GPT4 Turbo不相伯仲。自去年4月首次發(fā)布以來,商湯“日日新”大模型體系已推出五個大版本迭代。如今的5.0版本,基于龐大訓練數(shù)據(jù)和大量合成數(shù)據(jù),采用混合專家架構,創(chuàng)意寫作能力、推理能力以及總結能力均大幅提升,在金融、出行、辦公、IP角色等行業(yè)實現(xiàn)深耕落地。
日前,在上海唯一的大模型創(chuàng)新生態(tài)社區(qū)“模速空間”內,新銳企業(yè)智象未來在為即將發(fā)布的文生視頻模型做最后的技術攻堅。這款自研大模型,目標直指美國OpenAI團隊的視頻生成模型Sora,立志要用中國的人工智能講述中國故事,“輸入延時攝影星空閃爍,不到1分鐘可以生成出來一個視頻的片段”品牌負責人張一鳴對自家產(chǎn)品信心滿滿。
目前,在“模速空間”,類似智象未來這樣的大模型企業(yè)已超過60家,而上海已有24款大模型完成備案、可上線提供服務,數(shù)量位居全國前列。
身為業(yè)界中人,上海星云愛店科技有限公司首席技術官董繼明在節(jié)目中感慨,圍繞國產(chǎn)大模型的各個行業(yè)近年來確實“卷得不得了”,然而取得的長足發(fā)展也頗令人驚喜。
董繼明表示,3個月前他們嘗試性地將其從200萬用戶收集的任務問題,從國外先進大模型“切換”至國產(chǎn)大模型,以此檢測能否支撐他家產(chǎn)品——科研助手“萬能小in”的復雜運算。“無論輸入長度、邏輯性,還是趣味性,實際效果都超出我們的期望,而且文生圖的多模態(tài)能力也比較理想”,董繼明說,既然國產(chǎn)大模型能堪大用,索性就全量切到了國產(chǎn)大模型。
解決算力“焦慮” 要抓哪些關鍵要害?
算力、算法和數(shù)據(jù),是訓練人工智能大模型的三個關鍵要素。如果把大模型比喻成“身體”,那么維系身體機能運轉的“血液”則是海量的算力,尤其是智能算力。據(jù)預測,算力每投入1元錢,就將帶動3至4元的經(jīng)濟產(chǎn)出。
隨著人工智能技術更新迭代,對算力的需求也與日俱增。以GPT-3和GPT-4模型為例,二者對應的算力增長24倍??梢哉f,在數(shù)字時代,算力決定了人工智能技術創(chuàng)新的上限。
值得注意的是,在算力需求總量增長的同時,因供需錯位導致大量算力閑置的情況仍存在。目前,我國整體算力利用率不足30%,高端算力缺口相對較大。
上海市人工智能標準化技術委員會副秘書長、上海人工智能行業(yè)協(xié)會標準研究部部長陳曦認為,之所以會出現(xiàn)算力缺口問題,主要在于在這一輪大模型發(fā)展中,企業(yè)要將很大部分的研發(fā)成本投入在算力以及合規(guī)的語料數(shù)據(jù)上面。2022年在美國用顯卡訓練模型的成本比在中國高出一倍,而2023年在中國用進口顯卡訓練模型的成本達到了美國的兩倍,“而且,顯卡還不好買,推高了企業(yè)的算力成本?!?/span>
陳曦指出,這種情況迫使我們必須加快國產(chǎn)AI芯片升級,同時也欣喜地看到目前已有很多國產(chǎn)AI芯片可以實現(xiàn)大模型的推理,“我們也期待有朝一日,國產(chǎn)AI芯片可以正式在訓練階段得到很好的應用。”
夯實算力基礎設施建設 打造“智算產(chǎn)業(yè)”生態(tài)圈
當前,上海正持續(xù)夯實算力基礎設施建設,各個重點區(qū)域持續(xù)布局,助力構建全國一體化算力網(wǎng)。
臨港新片區(qū)的工地上,中國電信臨港智算中心一期工程的一部分算力設施已經(jīng)崛起。其中一間機房承載3000張GPU卡,4個機房通過網(wǎng)絡互聯(lián),形成了國內首個超萬卡液冷算力集群。工程建成后服務的大模型為萬億級參數(shù),對標GPT4.0即可融合文本、圖片、視頻多模態(tài)。
5月7日,包括“國產(chǎn)萬卡液冷集群賦能星辰大模型”等在內,一批大模型集群在臨港新片區(qū)正式啟動,進一步助力算力與大模型產(chǎn)業(yè)應用深化聯(lián)動。目前,臨港新片區(qū)已布局含三大運營商、商湯科技、有孚網(wǎng)絡等在內的8個算力中心,可調度算力約3EFLOPS,約占上海市總體算力20%。
除了臨港,上海還加快在青浦、松江、金山、張江等重點區(qū)域建設大型智算中心。其中,松江擁有10個大數(shù)據(jù)中心、算力中心項目,已批復3.4萬個機柜,落地了騰訊長三角人工智能先進計算中心、上海儀電智算中心等一批重大項目。規(guī)劃機柜數(shù)量近4萬架的騰訊長三角人工智能先進計算中心項目,建成后將成為亞洲領先的人工智能計算中心和全國最大的GPU計算集群。
董繼明服務的公司,坐落于全國首個大模型生態(tài)社區(qū)“模速空間”。“模速空間”位于徐匯濱江,與上海人工智能實驗室、商湯科技、阿里巴巴、騰訊等知名科研機構和科技企業(yè)毗鄰,形成了一個人工智能產(chǎn)研生態(tài)圈。
入駐“模速空間”的企業(yè)不僅可享受房租減免,還可獲得算力、數(shù)據(jù)、評測、金融等大模型研發(fā)所必需的資源,“這些原料單靠一家企業(yè)單打獨斗來積累,是非常困難的”董繼明說。此外,在市區(qū)兩級政府的支持下,購買算力資源的企業(yè)將得到現(xiàn)金補貼,每個季度補貼一次,“有了這個補貼以后,可以把我們的成本降低下來?!?/span>
讓董繼明最能體會“產(chǎn)業(yè)生態(tài)圈”福利的還有智慧的集聚與碰撞,“在我們吃飯、午休的時候,周圍都能結識到做大模型的人。大家常常在一起交流,甲公司用戶需要的應用場景,乙公司可以幫忙找到解決方案?!?/span>
“全球數(shù)據(jù)經(jīng)濟快速發(fā)展、人工智能大模型不斷更新迭代,算力是當下數(shù)字經(jīng)濟時代重要的戰(zhàn)略性資源,大家都在爭搶”,臨港新片區(qū)管委會數(shù)據(jù)處副處長倪曉杰介紹,最近在臨港,臨港集團“智算集群賦能港大自主算法平臺”、上海電信“國產(chǎn)萬卡液冷集群賦能星辰大模型”、商湯科技“日日新5.0大模型”等又一批大模型訓練集群正式啟動。
其中,“智算集群賦能港大自主算法平臺”用于3D生成和基于人工智能的藥物設計等方向的研究;“國產(chǎn)萬卡液冷集群賦能星辰大模型”為客戶提供大模型場景化應用一站式交付;“日日新5.0大模型”大幅提升了日日新大模型的訓練效率和推理速度,打造了國內首個全面對標GPT4的大模型,在金融、出行、辦公、IP角色等行業(yè)實現(xiàn)落地。“將這些訓練集群集聚在我們臨港新片區(qū),我們可以更好地服務各行業(yè)垂類大模型,同時在相關制度方面進行先行先試?!?/span>
國際競爭日趨激烈 上海有哪些優(yōu)勢?
有句話叫“算力即國力”,在數(shù)字經(jīng)濟與人工智能時代,算力已經(jīng)成為重要的資源之一,全球圍繞算力的競爭博弈也日益激烈。
從國家算力指數(shù)排名來看,美國和中國位列前兩位。2023年《中國算力發(fā)展指數(shù)白皮書》顯示,美國和中國在全球算力規(guī)模中的份額分別為34%、33%。位居全球第二的中國,算力總規(guī)模已經(jīng)達到197EFLOPS。算力規(guī)模近5年年均增速近30%,存力規(guī)模、運力質量也在不斷提升。
為了搶得先機,全球主要國家和地區(qū)都在持續(xù)加碼推進算力發(fā)展。2022年8月,拜登正式簽署《芯片與科學法案》,旨在鞏固美國在半導體領域的地位,并強化算力基礎設施應用和協(xié)同創(chuàng)新。2023年美國的《國家量子計劃》,則增加了對量子算法、應用程序等軟件工程的研發(fā)投資。歐盟也在不斷加大前沿計算技術研發(fā)和算力發(fā)展的投入?!?/span>2023至2024年數(shù)字歐洲工作計劃》就提出,要投入1.13億歐元提升數(shù)據(jù)與計算能力。
對標全球領先水平,上海正摩拳擦掌,強化算力產(chǎn)業(yè)發(fā)展的政策支持和保障。5月7日,上海臨港新片區(qū)發(fā)布5方面11項措施,計劃將臨港打造成具有重要戰(zhàn)略地位和全球影響力的算力高地。到2025年,力爭總算力超過5EFLOPS,智算占比達80%,算力產(chǎn)業(yè)總規(guī)模提升至100億元。
從全市層面來看,上海市通信管理局等11部門日前也印發(fā)方案,提出構建智算生產(chǎn)要素、打造智算應用場景等五方面重點任務,力爭到2025年,上海市智能算力規(guī)模將超過30EFlops,占比達總算力的50%以上。上海具備大規(guī)模應用賦能價值的智算中心數(shù)量達到10家,智能算力典型應用場景超過50個,爭取5個以上智算中心納入國家級算力基礎設施典型案例名單。
“盡管美國從Ai芯片到深度學習框架,以及核心算法仍然存在領先地位,但是我們也不必妄自菲薄”,陳曦指出,中國和上海有著最廣泛的消費人群,在移動互聯(lián)網(wǎng)時代就能創(chuàng)造出“殺手锏”級別的消費應用?!?/span>2024年是大模型應用場景元年,上海本身是一個超級巨大的場景城市,產(chǎn)業(yè)類別齊全,同時服務業(yè)高度發(fā)達,所以我們要利用算力提供的基礎保障和應用場景方面的優(yōu)勢,把握住大模型的發(fā)展機遇”陳曦說。
打造全球算力新高地,臨港新片區(qū)被寄予厚望。倪曉杰表示,今年政府工作報告提出“加快形成全國一體化算力中心”,算力網(wǎng)是促進全國范圍內各類算力大規(guī)模調度運營的數(shù)字基礎設施。臨港新片區(qū)地處長三角沿海界面的中心位置,在全國一體化算力網(wǎng)絡長三角樞紐節(jié)點中扮演重要角色,能形成算力能力對外輻射的優(yōu)勢。在新政的支持下,臨港新片區(qū)將持續(xù)優(yōu)化算力布局體系,在基礎設施、核心產(chǎn)業(yè)和示范場景三方面形成合力,打造智能算力“三位一體”的協(xié)同發(fā)展體系。
編輯: | 李瑤郝苗苗 |
責編: | 趙歆 |
劍網(wǎng)行動舉報電話:12318(市文化執(zhí)法總隊)、021-64334547(市版權局)
Copyright ? 2016 Kankanews.com Inc. All Rights Reserved. 看東方(上海)傳媒有限公司 版權所有
全部評論
暫無評論,快來發(fā)表你的評論吧