女人被狂躁到高潮呻吟小说,蜜桃成人网,女人与公豬交交30分钟视频,久久无码精品一区二区三区,浓毛老太交欧美老妇热爱乱

大模型下半場的比拼,為什么勝出的是聯(lián)想?

“大模型已經進入下半場?!痹谇安痪玫穆?lián)想創(chuàng)新科技大會(Lenovo Tech World 2025)上,中國信通院云計算與大數(shù)據(jù)研究所所長何寶宏做出了如此論斷。

中國信通院云計算與大數(shù)據(jù)研究所所長何寶宏

轉場的關鍵時間點是2024年12月。從那以后,深度求索(DeepSeek)接連發(fā)布了DeepSeek-V3基座大模型、DeepSeek-R1推理模型、Janus-Pro多模態(tài)大模型,達到了OpenAI同類型模型的同等水平,訓練成本卻只有5%,運行成本更是只有3%。

如果說大模型的上半場是卷算力的狂飆突進的話,下半場則轉入了效率為先的精耕細作。由于外部環(huán)境的變化,這種風格的切換,在中國市場尤甚。而這,當然也給中國的AI基礎設施供應商帶來了全新的挑戰(zhàn)。

新的賽場、新的規(guī)則、新的范式,誰能抓住新的機會?

最好的時代

正如何寶宏所言,大模型的下半場,最大的變化就是在上半場已經發(fā)揚光大的、追求“高性能”的高端賽道之外,又出現(xiàn)了一條追求“高性價比”的普惠賽道。

由于普惠賽道的出現(xiàn),使得AI基礎設施市場出現(xiàn)了“杰文斯悖論”:當技術進步提升資源利用效率后,資源消耗量非但未減少,反而進一步增長。

這是最好的時代。IDC數(shù)據(jù)顯示,2024年全球人工智能服務器市場規(guī)模預計為1251億美元,2025年將增至1587億美元,2028年有望達到2227億美元,其中生成式人工智能服務器占比將從2025年的29.6%提升至2028年的37.7%。

中國市場的情況還要更為樂觀。同樣是根據(jù)IDC的預測,2023-2028年期間,中國智能算力規(guī)模的五年年復合增長率預計達到46.2%,通用算力規(guī)模預計達到18.8%。較上一版本的預期值33.9%和16.6%,均有顯著提升。

最壞的時代

這也是最壞的時代。如今,由于大模型應用客戶需求的巨大變化,也給所有的中國AI基礎設施供應商提出了新的要求,他們必須盡快適應巨變并做到“四化”:

1.多元化:由于人工智能在國內的應用場景較為復雜,同時受到地緣、供應鏈等因素影響,人工智能芯片類型與廠商呈現(xiàn)出多元化的趨勢,GPU、CPU、DSA、ASIC等多種芯片被廣泛應用在人工智能的訓練與推理中,不少場景實現(xiàn)了多類型芯片的混合使用。在芯片廠商方面,諸多國內廠商開始嶄露頭角,提供了大規(guī)模的算力集群方案。

2.服務化:為滿足不同的算力需求,人工智能算力服務不斷革新。生成式人工智能IaaS服務可為企業(yè)按需提供容量,支持靈活的模型訓練和內容生成;算力租賃使用戶按需租賃計算資源,降低成本并提高靈活性;算力共享通過資源池化和動態(tài)調度,實現(xiàn)資源共享和成本分攤;智算中心集成高性能的計算、存儲和網絡資源,提供高可用的一站式服務,支持大規(guī)模人工智能應用。

3.場景化:人工智能算力基礎設施的多樣化,旨在應對不同行業(yè)和應用場景的多樣化需求。例如,金融行業(yè)需要高安全性和低延遲的計算環(huán)境,醫(yī)療行業(yè)需要處理大量醫(yī)學影像數(shù)據(jù),制造業(yè)需要實現(xiàn)實時生產優(yōu)化,互聯(lián)網行業(yè)需要處理大規(guī)模用戶數(shù)據(jù)和內容推薦。這些需求對底層架構提出了高性能、低延遲、高安全性、可擴展性和成本效益等新要求。

4.綠色化:在雙碳目標的指引下,全國范圍內對綠色發(fā)展的重視程度和投資力度不斷加大。政策上來說,一方面國家對于數(shù)據(jù)中心的新建審批及能耗要求上持續(xù)趨嚴;另一方面也會通過諸如電費分段計價等引導數(shù)據(jù)中心綠色化發(fā)展。

這樣的新時代,中國的AI基礎設施供應商該如何應對?

“四策”對“四化”

針對AI基礎設施的“四化”,中國的AI基礎設施供應商們同樣也在行動起來,以“四策”來應對。

1.支持異構計算。如今在全球,異構計算大行其道;在中國市場,這個趨勢則更加明顯。IDC預測,到2029年中國加速服務器市場規(guī)模將超過千億美元,其中非GPU服務器市場規(guī)模將接近50%。即使是在超過市場規(guī)模一半的GPU服務器市場,由于中國特有的環(huán)境,NVIDIA不再一枝獨秀,而是出現(xiàn)了天數(shù)智芯、沐曦、摩爾線程、華為、燧原科技、壁仞科技、海光信息、寒武紀等諸多國產芯片廠商。對于中國AI基礎設施供應商來說,關鍵就是要做好這些芯片廠商的適配。

2.算存網齊頭并進。對于如今的AI基礎設施提供商來說,計算、存儲、網絡能力必須同時提升。他們必須采用先進的計算架構,提升單計算節(jié)點性能,提高計算效率;還需要優(yōu)化內存層次結構,減少數(shù)據(jù)傳輸延遲,增強數(shù)據(jù)處理速度;還得利用智能調度算法合理分配計算任務,優(yōu)化集群管理方面,確保資源高效利用。面對智算客戶的時候,他們還需要交付算存網一站式解決方案。

3.打造場景化產品。當然,AI基礎設施提供商更需要針對大模型的各種應用場景,打造針對性的產品。例如,針對目前高速增長的推理場景,推出更適合推理的AI服務器;針對國內客戶希望盡快用上滿血版DeepSeek大模型并進行本地化部署的場景,發(fā)布DeepSeek一體機產品。

4.普及綠色技術。為了盡快實現(xiàn)雙碳目標,業(yè)界積極探索破局之道。其中,液冷技術作為關鍵突破,可以顯著提升計算密度,降低數(shù)據(jù)中心的總能耗。通過全棧液冷方案,將推動算力設施在計算節(jié)點層面、機柜層面以及數(shù)據(jù)中心層面的綠色化和低碳化轉型。

六大創(chuàng)新技術

從聯(lián)想創(chuàng)新科技大會上,我們已經看到,聯(lián)想已經為下半場做好了充足的準備。

面對AI技術的持續(xù)創(chuàng)新和用戶需求的快速變化,聯(lián)想從算力性能與效能、核心算法、算力服務等多個維度再次發(fā)布六大創(chuàng)新技術:

1.AI推理加速算法集。針對大模型引發(fā)的推理需求爆發(fā),AI推理加速算法集結合了MLA-多頭潛在注意力機制、投機推理等業(yè)界新興方法,以及聯(lián)想長期優(yōu)化的混合精度量化、分布式并行等算法,為推理加速打造強大的工具箱,助力用戶突破推理性能極限,實現(xiàn)AI推理性能提升5-10倍。同時,相對于業(yè)界最優(yōu)的社區(qū)方案,聯(lián)想的AI推理性能保持20%以上的優(yōu)勢。

2.AI編譯優(yōu)化器。針對各個行業(yè)對大模型后訓練與推理結合的前沿需求,AI編譯優(yōu)化器在訓練或推理過程中能夠自動化替換高效算子、優(yōu)化計算路徑,并進行自動重編譯,大幅簡化復雜的AI計算過程,在提升AI訓推效率的同時,還實現(xiàn)了降低訓練和推理計算開銷各15%以上。

3.AI訓推慢節(jié)點故障預測與自愈系統(tǒng)。面對大規(guī)模AI計算集群的運維需求,該系統(tǒng)通過對集群異步實時狀態(tài)監(jiān)測與全面故障分析,以AI預測AI故障,在節(jié)點性能下降前發(fā)現(xiàn)問題,并自動化解決故障,實現(xiàn)故障自愈時間控制在百卡秒級、千卡分鐘級、萬卡十分鐘級。

4.專家并行通信算法。面向AI計算集群不斷提升的網絡能力需求,該算法通過對通信計算原語、訪存方式和網絡路由算法的協(xié)同優(yōu)化,實現(xiàn)了推理延時降低3倍以上,網絡帶寬利用率從50%提升至90%。

5.“飛魚”仿生散熱設計與浸沒式制冷系統(tǒng)。在液冷領域,該系統(tǒng)成功突破了散熱器性能瓶頸,最大支持功耗提升20%;同時,聯(lián)想還發(fā)布了“雙循環(huán)”相變浸沒制冷系統(tǒng),通過創(chuàng)新的外接單相換熱器設計,實現(xiàn)散熱能力較傳統(tǒng)方案翻倍提升,系統(tǒng)PUE低至1.035。

6.算力服務“成本-效能”雙優(yōu)運營系統(tǒng)。該系統(tǒng)從服務服務方面幫助提升用戶運營效能,優(yōu)化運營成本。

在支持異構計算方面,聯(lián)想也做得足夠深入?!癉eepSeek大模型也好,通義千問3也好,它們的滿血版在一些國產GPU上都已經跑通了,不僅僅是跑通,還做了調優(yōu)?!甭?lián)想中國基礎設施業(yè)務部戰(zhàn)略管理部總監(jiān)黃山透露,聯(lián)想與8大國產GPU廠商開展了廣泛的合作,甚至深入到了算子級別。

聯(lián)想中國基礎設施業(yè)務部戰(zhàn)略管理部總監(jiān)黃山

兩大重磅升級

除了發(fā)布六大創(chuàng)新技術之外,聯(lián)想還宣布了兩大重磅升級:

第一大重磅升級是發(fā)布了聯(lián)想萬全異構智算平臺3.0版本,新增了AI推理加速算法集、AI編譯優(yōu)化器、AI訓推慢節(jié)點故障與自愈系統(tǒng)、專家并行通信算法等四大突破性創(chuàng)新技術,直擊大模型應用落地的關鍵痛點,從而為DeepSeek R1/V3等千億級大模型提供更高效的運行環(huán)境,并不斷突破算力效率極限。

在該平臺的加持下,實測單機部署DeepSeek 671B模型吞吐突破12000 tokens/s,在極限場景下更是創(chuàng)下37000+ tokens/s的行業(yè)新紀錄,充分展示了聯(lián)想萬全異構智算平臺的技術領先性。

第二大重磅升級,是聯(lián)想AI基礎設施從計算力、存儲力到運載力的全線升級:

1.計算力。如今,隨著AI應用進入百花齊放的后訓練時代,聯(lián)想提出打造“更強大、更穩(wěn)定、更高效、更綠色”的算力基礎設施,并針對業(yè)務數(shù)據(jù)到智能業(yè)務全過程的三個關鍵應用場景——數(shù)據(jù)處理、模型訓練和推理應用分別進行優(yōu)化,形成數(shù)據(jù)處理算力服務器、AI訓練算力服務器、推理應用算力服務器三大家族。

在這次聯(lián)想創(chuàng)新科技大會上,聯(lián)想重磅推出基于英特爾?至強?6處理器的全新算力服務器家族,包括聯(lián)想問天 WA7880a家族在內的AI訓練算力服務器家族、聯(lián)想ThinkSystem SC750 V4在內的數(shù)據(jù)處理算力服務器家族;聯(lián)想問天 WA5480 G5、WR5220 G5、聯(lián)想ThinkSystem SR650 V4、SR650a V4、SR630 V4在內的推理應用算力服務器家族。面向不同的AI應用場景,全新算力服務器家族進行了針對性優(yōu)化,充分釋放AI服務器的算力潛能。

2.存儲力。聯(lián)想最新發(fā)布了凌拓全新存儲產品家族,以及具備本地自研、自有知識產權、自主可控三大特征的聯(lián)想存儲新品牌聯(lián)想問天。聯(lián)想凌拓從數(shù)據(jù)管理到存儲架構均進行了全方位升級,包括聯(lián)想問天DXN AI 存儲解決方案、DXN2000系列、DXN 全閃系列,Lenovo ThinkSystem DE/DM/DG系列、NetApp ASA/AFF/FAS系列、AIPod DeepSeek一體機在內的聯(lián)想凌拓全新存儲產品家族,滿足AI存儲時代各個行業(yè)的需求。

3.運載力。聯(lián)想通過RoCE/IB多架構融合及低延遲優(yōu)化技術,構建了覆蓋多種規(guī)模AI算力集群的智能網絡體系。其數(shù)據(jù)網絡產品兼容多種主流AI網絡架構。最新發(fā)布的高密度400G交換機聯(lián)想問天NE8770-64QC專為AI場景深度優(yōu)化。同步亮相的還包括兩款戰(zhàn)略級新品——面向下一代融合網絡的多業(yè)務核心交換機聯(lián)想問天NE7550G-8C,以及支持超大規(guī)模組網的新一代高性能核心交換機聯(lián)想問天NE9770G-4C。

此外,在軟件及超融合領域,聯(lián)想還升級了AIO V6系列產品和聯(lián)想問天WX系列虛擬化超融合8.0.2版本。聯(lián)想AIO超融合解決方案已實現(xiàn)2000+企業(yè)級客戶部署,累計支撐超20000個核心業(yè)務系統(tǒng)平穩(wěn)運行。

從以上六大創(chuàng)新技術和兩大重磅升級可以看出,在應對大模型下半場的“四策”(支持異構計算、算存網齊頭并進、打造場景化產品、普及綠色技術)上,聯(lián)想已經走在了行業(yè)的最前列。

成為領軍者

新的時代,也意味著新的機會。聯(lián)想集團副總裁、中國基礎設施業(yè)務群總經理陳振寬表示:“在各種創(chuàng)新疊加下,算力已不再僅僅是AI落地的底座,相反,正作為新興的技術引擎推動中國AI新時代的落地?!?/p>

聯(lián)想集團副總裁、中國基礎設施業(yè)務群總經理陳振寬

如今的聯(lián)想,已經開始收獲果實。眾所周知,在AI基礎設施當中,最主力的產品就是AI服務器。聯(lián)想中國基礎設施業(yè)務群服務器產品部總經理周韜透露,去年聯(lián)想服務器在中國市場創(chuàng)造了180%的驚人增速。究其原因,就是在AI服務器市場獲得了大豐收?!叭ツ甑靡嬗贏I的大發(fā)展,我們在互聯(lián)網、電信運營商、制造業(yè)、智算中心等領域都有比較大的突破?!?/p>

聯(lián)想中國基礎設施業(yè)務群服務器產品部總經理周韜

就在前不久,聯(lián)想發(fā)布了2024/2025財年年報。其中,基礎設施方案業(yè)務集團(ISG)表現(xiàn)優(yōu)異,營收同比暴漲了63%,并在下半財年成功扭虧為盈。

如今,六大創(chuàng)新技術、兩大重磅升級的發(fā)布,將進一步夯實聯(lián)想在AI基礎設施領域的基礎,并向著廣為廣闊的市場進發(fā)。周韜表示,在互聯(lián)網這個最重要的細分市場,聯(lián)想除了繼續(xù)擴大在Tier1的市場份額之外,還要進軍Tier2。

面向AI的新十年,聯(lián)想已經開啟創(chuàng)業(yè)5.0時代。聯(lián)想集團董事長兼CEO楊元慶表示,超級智能體時代,聯(lián)想將致力于助力合作伙伴率先擁抱AI,攜手把握這波機遇,深挖并服務好客戶的人工智能新需求,成為行業(yè)的領軍者。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2025-05-29
大模型下半場的比拼,為什么勝出的是聯(lián)想?
大模型下半場的比拼,為什么勝出的是聯(lián)想?

長按掃碼 閱讀全文