DeepSeek引發的AI狂潮熱度不減。 憑借低成本、高性能、開源等特點,DeepSeek-R1“爆火”之後,國內多個雲平台宣布上線DeepSeek旗下模型。2月4日,字節跳動旗下的雲服務平台火山引擎宣布,將支持V3、R1 等不同尺寸的DeepSeek開源模型;騰訊雲繼2日宣布其高性能應用服務HAI支持DeepSeek-R1一鍵部署之後,4日又宣布騰訊雲TI上架DeepSeek係列模型;百度智能雲則於3日晚宣布,百度智能雲千帆平台已正式上架DeepSeek-R1和 DeepSeek-V3模型;阿裏雲PAI Model Gallery目前也已支持DeepSeek-V3、DeepSeek-R1以及所有蒸餾小參數模型(DeepSeek-R1-Distill)的一鍵部署。 在這背後,是雲廠商們不願在DeepSeek的火爆中缺席,賣起了自身的產品、服務以及算力。而更深層次的行業變化是,大模型的算力需求正在經曆變遷。DeepSeek曾公開DeepSeek-V3的訓練預算為“2048個GPU、2個月、近600萬美元”,外界認為DeepSeek-R1訓練成本可能也偏低。這或許意味著,大模型訓練不一定能為雲廠商持續帶來大量算力需求,但開發者部署偏重推理的大模型,可能會為雲廠商帶來更多算力需求。 在海外市場,蛇年春節期間,DeepSeek的優異表現以及不及OpenAI近1/20的算力成本令英偉達(Nasdaq:NVDA)股價一夜暴跌17%。英偉達等科技巨頭股價在後續幾天有所反彈,華爾街亦開始對“中國AI衝擊”進行更理性的分析。DeepSeek的問世意味著更多新進入者,算力的需求將有增無減,不過,未來的熱點可能會從“鏟子”向應用端切換,更多AI公司將會受益。 多個雲平台上線相關模型背後 DeepSeek-R1是一款開源模型,也提供了API(接口)調用方式。據DeepSeek介紹,DeepSeek-R1後訓練階段大規模使用了強化學習技術,在隻有極少標注數據的情況下提升了模型推理能力,該模型性能對標OpenAl o1正式版。DeepSeek-R1推出後,該模型熱度持續攀升。1月27日,DeepSeek應用曾登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜。 麵向潛在的算力需求,騰訊雲TI平台上架了“滿血”的 V3、R1原版模型,這兩個模型參數量都達到671B(B即十億),並上架了基於DeepSeek-R1蒸餾得到的係列模型,參數規模從1.5B到70B不等。騰訊雲TI平台還提供模型服務管理、監控運營、資源伸縮等能力,幫助企業和開發者將DeepSeek模型接入實際業務。 盡管DeepSeek-R1是開源模型,但雲廠商們在各自平台提供的適配服務,可以讓用戶更輕鬆地實現從訓練到部署再到推理的全過程,簡化模型開發流程,“收攏”部分DeepSeek用戶的需求。目前,百度智能雲千帆平台上架的DeepSeek-R1和 DeepSeek-V3模型則已全麵融合千帆推理鏈路,集成百度獨家內容安全算子,實現模型安全增強與企業級高可用保障,同時支持完善的BLS日誌分析和BCM告警。 阿裏雲也麵向開發者提供了蒸餾過後的DeepSeek-R1-Distill-Qwen-7B模型,基於DeepSeek-R1的推理能力,通過蒸餾技術將推理模式遷移到較小的Qwen(通義)模型上,以便更高性價比地實現DeepSeek係列模型與現有業務的高效融合。阿裏雲相關人士對記者表示,部署DeepSeek-R1-Distill-Qwen-7B模型的價格約為11.1元/小時(以A10機型為例,其餘機型的價格參考阿裏雲官網);部署DeepSeek-R1模型的價格約為316元/小時。 同時,不少雲廠商都給出了低於DeepSeek官方刊例價的折扣。目前,DeepSeek-R1的官方刊例價為輸入4元/M tokens,輸出16元/M tokens,DeepSeek-V3的官方刊例價為輸入2元/M tokens,輸出8元/M tokens。 記者從百度雲了解到,百度雲上架的對應模型調用價格為DeepSeek-V3官方刊例價的3折、DeepSeek-R1官方刊例價的5折,並提供限時2周的免費服務。阿裏雲百煉上架的DeepSeek-R1和DeepSeek-V3也宣布限時免費。火山引擎也在公開信息中表示,通過全棧自研推理係統對 DeepSeek 的優化和降本,火山引擎為通過方舟調用 DeepSeek 模型 API 的企業提供有競爭力的價格,並提供全網最高的限流。 2024年,DeepSeek-V2的發布曾引發了一輪大模型價格戰,字節、百度、騰訊、阿裏等大模型廠商都曾跟進降價。如今,有“AI界拚多多”之稱的DeepSeek是否會掀起大模型的下一輪價格戰受到業界關注。 業界對大模型價格競爭已有預期。今年1月,騰訊集團副總裁、政企業務總裁李強在接受第一財經等媒體采訪時表示,價格變化如果不是基於技術創新就很難長期持續,騰訊對低效率的純粹價格競爭未必完全認同,預計2025年傳統雲計算領域的價格競爭會趨緩,但與大模型相關的部分還是會有價格競爭。李強表示,大模型本身帶來的收入占整體市場的規模還比較小,但長期看,大模型行業化應用將更多帶來推理相關的計算需求。隨著越來越多企業用戶和創業公司轉向大模型應用,預計應用爆發將帶來大量推理需求。 焦點將從“鏟子”轉向應用層 在蛇年春節期間,“DeepSeek”是主導海外市場的關鍵詞,一度令美股“科技七巨頭”股價大幅跳水,英偉達股價一度創下美國上市公司單日市值損失紀錄,科技股普遍重挫,目前這段大幅波動似乎已經告一段落。 某AI相關科研人士對記者稱:“DeepSeek的原理和OpenAI o1不太一樣,訓練模式區別很大,而且更直觀、可解釋。DeepSeek因預算或高端芯片有限,因此必須優化訓練流程,這就是中國‘卷王’登場的地方了。” 英偉達被稱為“AI淘金潮”下那個“賣鏟子的人”,不過未來的熱點可能會繼續向中下遊切換,更多AI公司將會受益。 高盛科技分析師Eric Sheridan和他的團隊強調,AI主題的下一階段演進可能會從基礎設施層轉向應用層(如AI智能體、企業應用場景、消費者實用性提升和計算習慣的改變)。這些將成為未來2025年及以後的可識別關鍵驅動力,從而帶來更線性、可理解的資本回報。 在科技巨頭中,投行認為,穀歌和Meta相對處於特別有利的位置,因為它們在AI的“應用層”推進方麵走得最遠。不過更多中小企業也將迎來更多機會。富蘭克林股票團隊首席投資官柯蒂斯(Jonathan Curtis)此前對記者稱,在應用端將有更多使用案例出現,好比5G主題從上遊基站向下遊手機應用擴散一樣,也會有更多科技公司運用生成式AI技術來提高產品或服務的價值。在轉型過程中,將有更多市值較低的企業受惠,特別是軟件和互聯網服務等行業。 中國AI主題受關注 近兩年來,中國AI企業的發展大超預期,DeepSeek的爆紅無疑增加了相關主題的吸引力。OpenAI原全球市場應用負責人、人工智能與商業戰略專家Zack Kass近期對記者表示,早在兩年前他就認為,在未來AI競賽中,中國不一定會落後,中國可以用更少的GPU構建模型。 在他看來,2025年,人工智能的發展可能會進入一個新的階段,人們將開始真正認同“模型即商品”的理念,即使模型將越來越便宜和可觸達。這並不意味著不再投資於模型,而是強調多樣性和選擇的重要性。特別是中國可能不會再糾結於“本土人工智能落後”的觀念,因為前沿模型之間的性能差距正在縮小,使用戶在體驗上幾乎感受不到太大區別。隨著模型逐步趨同,人們的關注點將從“誰的模型更強”轉向如何更有效地采用和應用這些模型。 高盛則認為,未來AI推理與後訓練環節受到更多重視,推理計算資源需求低於預訓練,將成為下階段增長重點。中國AI企業具備全球競爭力。 尤其是在To C應用方麵,中國企業具備先發優勢,核心盈利模式則是廣告、訂閱等增量收入,最終實現AI應用可持續變現。 在雲計算和數據中心領域,圍繞芯片、算力限製的地緣政治不確定性依然存在,但訓練、推理成本優化的進展也在提速,機構預計,互聯網巨頭的雲業務和數據中心將受益於持續增長的公共雲和AI計算需求,特別是在AI采用加速的背景下。 |