在過去一周,中國的人工智能大模型,成為美國硅谷乃至全球科技人士熱議“東方神秘力量”的話題。引發(fā)熱議的正是中國的人工智能初創(chuàng)公司DeepSeek“深度求索”。今天,DeepSeek應(yīng)用超越ChatGPT、登頂蘋果美國地區(qū)應(yīng)用商店免費APP下載排行榜。而在蘋果中國區(qū)應(yīng)用商店免費榜上,DeepSeek今天也高居榜首。
“深度求索”公司上周發(fā)布的推理大模型DeepSeek-R1,因其比肩OpenAl o1的性能和極低的服務(wù)價格震驚業(yè)界。“深度求索”公司表示,R1在后訓練階段大規(guī)模使用了強化學習技術(shù),在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力。此外,DeepSeek-R1的預訓練費用只有557.6萬美元,不到OpenAI GPT最新版本訓練成本的十分之一。DeepSeek甚至被戲稱為AI界的“拼多多”。這也就是說,DeepSeek以較低的成本,實現(xiàn)了高性能的AI模型,由此也具備了更多市場競爭優(yōu)勢。
分析人士評價說,“深度求索”公司以200人左右的小團隊,不依靠外部融資,早期購入很多算力卡,投入資源做研究,做出了一個有性價比,并被廣泛認可的大模型。
受相關(guān)消息提振,今天,DeepSeek概念股表現(xiàn)強勢,每日互動、華金資本等相關(guān)個股漲?;驖q幅居前。
“深度求索”公司成立于2023年7月,是一家注冊在杭州的創(chuàng)新型科技公司,專注于開發(fā)先進的大語言模型(LLM)和相關(guān)技術(shù)。
DeepSeek頁面極為簡潔,主框上只有深度思考、聯(lián)網(wǎng)搜索、發(fā)送三個按鈕。公開信息顯示,在數(shù)學、代碼、自然語言推理等任務(wù)上,性能比肩OpenAI o1正式版。
從常規(guī)的新聞搜索功能來看,DeepSeek的亮點在于,總結(jié)簡潔,而且重點突出,收集的內(nèi)容也不局限于國內(nèi)平臺,部分消息來自海外新聞媒體,點擊鏈接可直達海外的新聞網(wǎng)站。
與此同時,DeepSeek的數(shù)學題解答能堪稱快速、準確。除了能夠正確回答問題,還能詳細展示思考步驟,部分問題還能反復驗證答案,甚至使用其他方式再計算一次。
不過,總結(jié)目前市面上多款AI大模型發(fā)現(xiàn),內(nèi)容總結(jié)能力都較為一般,普遍會出現(xiàn)重點缺失,車轱轆話來回轉(zhuǎn)的情況。在實際評測中,DeepSeek也出現(xiàn)了類似的情況,總結(jié)內(nèi)容時容易變成“歸納大綱和標題”,導致信息缺失。
DeepSeek的橫空出世,就像當初的ChatGpt,一石激起千層浪。那么,DeepSeek憑借哪些表現(xiàn)在AI界殺出重圍?復旦大學信息科學與工程學院副教授凌力指出,DeepSeek團隊是“厚積薄發(fā)”,之前就在不斷地研究,這個小團隊集聚了人工智能方面的一些專家,擁有一些創(chuàng)新的思維。以小成本的投入就能達到同樣水平AI的能力,是非常有意義的。因為如果AI大模型投入要求非常高的話,就把很多公司擋在外面了。有效壓低成本,業(yè)界生態(tài)就會繁榮,各行各業(yè)都可以用AI賦能來提升自身能力。
DeepSeek、字節(jié)跳動等中國企業(yè)的出現(xiàn)和發(fā)力,讓美國意識到,管制并不能阻止中國持續(xù)推進AI技術(shù)研發(fā),并在這一領(lǐng)域取得領(lǐng)先。
《福布斯》發(fā)文指出,DeepSeek讓世界認識到,中國并未退出這場人工智能的競賽。
《紐約時報》則稱,如果最好的開源技術(shù)來自中國,美國開發(fā)人員將在這些技術(shù)的基礎(chǔ)上構(gòu)建他們的系統(tǒng)。從長遠來看,這可能會讓中國成為研發(fā)AI的中心。
不過,DeepSeek依然面臨競爭對手囤積大量算力的挑戰(zhàn)。本周,特朗普宣布,OpenAI與甲骨文、日本軟銀集團共同創(chuàng)立一家5000億美金投資新計劃公司“星際之門”,在美國至少投資1000億美元,用于AI基礎(chǔ)設(shè)施。同時,馬斯克的xAI也正在大規(guī)模擴展其超級計算機,以容納超過100萬個GPU,幫助訓練其Grok AI模型。
目前來看,DeepSeek證明開源并沒有落后,但是,DeepSeek是否會因此面臨美國政府的針對性限制,最終導致模型訓練和算力受到制約,依然存在巨大不確定性。
DeepSeek是中國在AI界的一次彎道超車嗎?未來AI還將如何進化?國產(chǎn)大模型怎樣走得更遠、腳步更堅實?復旦大學信息科學與工程學院副教授凌力表示,DeepSeek的突破意義重大,但我們也要更理性地來看待,因為,目前來看,它還只是在效果上跟國外先進的模型處于并列狀態(tài),未來是不是還能夠進一步做得更好,這一點還要拭目以待。目前,國內(nèi)芯片的性能暫時還是弱于國外的同類產(chǎn)品。所以,人工智能的模型,如果能降低對國外高性能芯片的依賴,或許是一個努力的方向。此外,首先要讓人工智能變成生產(chǎn)力工具,才是有意義的。一定要跟各行各業(yè)的生產(chǎn)過程結(jié)合起來,一是要把AI模型變成一種智能體,融合到生產(chǎn)過程當中,生成一些指令去控制設(shè)備或者解決實際問題。另外一種發(fā)展方向,是人工智能要變成通用人工智能,能夠更好地像人類思考一樣,成為思考、研究、生產(chǎn)活動的助手。
編輯: | 阮麗 |
責編: | 嚴相莉 |
劍網(wǎng)行動舉報電話:12318(市文化執(zhí)法總隊)、021-64334547(市版權(quán)局)
Copyright ? 2016 Kankanews.com Inc. All Rights Reserved. 看東方(上海)傳媒有限公司 版權(quán)所有
全部評論
暫無評論,快來發(fā)表你的評論吧