8月7日,2025開放計算技術(shù)大會在北京舉行。大會聚焦在MoE大模型與AI智能體的技術(shù)發(fā)展趨勢下,如何以開放計算更好的促進縱向擴展性能(Scale up)與橫向擴展效率(Scale out)的協(xié)同發(fā)展。當前,模型算法開源、算力系統(tǒng)開放,已經(jīng)成為AI時代一個主流趨勢,開源開放的全球化協(xié)作平臺正發(fā)揮越來越重要的作用,既能以系統(tǒng)化思維,通過提升單系統(tǒng)性能,滿足萬億參數(shù)大模型發(fā)展的需求;又能應對日益擴張的數(shù)據(jù)中心規(guī)模,通過全球產(chǎn)業(yè)鏈協(xié)作解決未來GW級AI數(shù)據(jù)中心面臨的系統(tǒng)性工程挑戰(zhàn)。
2025開放計算技術(shù)大會由開放計算社區(qū)OCP及開放標準組織OCTC(中國電子工業(yè)標準化技術(shù)協(xié)會開放計算標準工作委員會)聯(lián)合主辦,以“開放變革:筑基、擴展、進化”為主題,聚焦計算、存儲、網(wǎng)絡、液冷等基礎設施底層架構(gòu)的技術(shù)創(chuàng)新,算法與算力系統(tǒng)、硬件和軟件的協(xié)同創(chuàng)新,以及開放計算技術(shù)賦能人工智能熱門應用等議題,來自中國移動、字節(jié)跳動、阿里云、三星、浪潮信息、清華大學、立訊技術(shù)等超千位知名學者、技術(shù)專家、應用開發(fā)者及廠商代表參與大會。
開源開放加速全球化協(xié)作,推動AI普惠
開源大模型(如Llama3、DeepSeek、Qwen、GLM、MiniMax)的意義已超越技術(shù)本身,深刻重塑全球AI產(chǎn)業(yè)格局和發(fā)展路徑。它們大幅降低了獲取、部署和定制先進AI能力的門檻,使各類企業(yè)與個人開發(fā)者都能便捷利用頂尖技術(shù),推動研發(fā)范式從封閉走向開放協(xié)作,顯著降低技術(shù)壁壘,加速實現(xiàn)“智能平權(quán)”。與之伴生的是,公共云平臺和模塊化AI基礎設施的普及,為開源模型的規(guī)?;涞睾蛻脛?chuàng)新提供了至關(guān)重要的開放算力基礎。這種開源模型與開放算力的結(jié)合,會有效驅(qū)動海量長尾應用爆發(fā),進一步加速AI普惠的實現(xiàn)。
OCP基金會高級總監(jiān)Michael Schill表示,“過去的十數(shù)年間,開放計算項目(OCP)所建立的全球化協(xié)作創(chuàng)新模式成功開發(fā)及實施了數(shù)以百計的項目,在極大激發(fā)創(chuàng)新活力的同時也重塑著數(shù)據(jù)中心產(chǎn)業(yè)。隨著AI日益成為社區(qū)成員關(guān)注的核心場景,OCP的工作重心正轉(zhuǎn)向AI主導,所有核心工作圍繞著AI開放系統(tǒng)(Open Systems for AI)戰(zhàn)略計劃展開,包括數(shù)據(jù)中心物理基礎設施、數(shù)據(jù)中心IT基礎設施和系統(tǒng)管理三個重點領域,并且發(fā)布了《可擴展基礎設施的藍圖》,這是AI開放系統(tǒng)戰(zhàn)略計劃當中的重要工作成果。”
OCTC秘書長陳海認為:“產(chǎn)業(yè)協(xié)同創(chuàng)新要從應用出發(fā)、從用戶思維出發(fā),堅持標準引領產(chǎn)業(yè)發(fā)展,制定更切實落地的規(guī)范標準,推動和加速數(shù)據(jù)中心各領域的技術(shù)創(chuàng)新與成果普惠,讓更多的組織和個人從中獲益。例如,面向多元計算資源組合和多應用場景的服務器算力算效評估基準,就是通過系統(tǒng)評估服務器整機的綜合算力與能效表現(xiàn),為行業(yè)提供科學、可信的算力算效評估體系,為用戶服務器架構(gòu)選型和優(yōu)化提供標準范式。”
針對指數(shù)級增長的智算需求,OCTC與OCP聚焦現(xiàn)階段用戶需求與產(chǎn)業(yè)技術(shù)方向,正在探討如何加強雙方在開放算力、液冷等方面的合作,兩大社區(qū)的互通合作將形成一個更加融通的、更多地區(qū)、國家和行業(yè)通行的國際化標準,讓底層技術(shù)實現(xiàn)全球共享,加速技術(shù)普惠。
聚焦當下:創(chuàng)新超節(jié)點架構(gòu)凸顯產(chǎn)業(yè)鏈融合創(chuàng)新之力
毋庸置疑,開放計算的興起與日益壯大,使得數(shù)據(jù)中心產(chǎn)業(yè)鏈的協(xié)同效應更緊密、融合創(chuàng)新能力更強,這一點對于飛速迭代的AI產(chǎn)業(yè)至關(guān)重要。
目前,MoE大模型的參數(shù)量仍在保持高速增長且迭代迅速,對單系統(tǒng)的算力密度與互聯(lián)速率提出極致要求,帶動了計算架構(gòu)的變革。此次大會重點探討并集中展示了創(chuàng)新的超節(jié)點計算架構(gòu),在高速互聯(lián)、通信協(xié)議、內(nèi)存控制、系統(tǒng)架構(gòu)設計等層面實現(xiàn)全維度創(chuàng)新,能夠滿足萬億級別參數(shù)MoE大模型應用需求,凸顯出開放計算的產(chǎn)業(yè)鏈融合創(chuàng)新之力。
2025 OCTC輪值主席、中國移動通信有限公司研究院副院長段曉東指出,MoE大模型持續(xù)推高大算力,仍然是今天的時代主題,產(chǎn)業(yè)將會很快邁入以超節(jié)點這種網(wǎng)絡和算力、軟件和硬件全面協(xié)同優(yōu)化的一個時代。超節(jié)點打破了傳統(tǒng)服務器的物理邊界,觸發(fā)了系統(tǒng)性變革,互聯(lián)技術(shù)成為提升集群有效算力的關(guān)鍵。隨著卡間互聯(lián)技術(shù)的發(fā)展,開放互聯(lián)架構(gòu)將在下一代智算集群中發(fā)揮重要作用。
阿里云基礎設施異構(gòu)硬件和系統(tǒng)資深總監(jiān)盧曉偉表示,超大規(guī)模MoE帶來了AI基礎設施的算力、互聯(lián)、能耗瓶頸,以及可靠性和穩(wěn)定性的挑戰(zhàn),需要為AI重構(gòu)算力系統(tǒng),Scale Up 超節(jié)點架構(gòu)將成為核心發(fā)展路徑。超節(jié)點架構(gòu)所需的關(guān)鍵技術(shù)包括原生語義、極致帶寬、極低時延和高可靠的鏈路,軟硬件協(xié)同是命脈。
三星電子副總裁、先行開發(fā)團隊負責人張實完表示,MoE大模型帶來的超高數(shù)據(jù)傳輸需求,驅(qū)動內(nèi)存在高性能、高密度、散熱管控、安全性等方向持續(xù)演進。未來,超節(jié)點架構(gòu)將會采用GPU發(fā)起式直連內(nèi)存,通過GPU友好型介質(zhì)與存儲,有效減少內(nèi)存瓶頸,為大模型訓練推理提供強力支持。
字節(jié)跳動服務器架構(gòu)師高曉軍表示,服務器開放架構(gòu)的進化,本質(zhì)是通過技術(shù)迭代更好地釋放多樣性算力潛能。開放架構(gòu)的持續(xù)進化,如同為算力基座注入 “自適應基因”,使其既能兼容當下的多樣性算力,又能支撐未來的技術(shù)創(chuàng)新。當產(chǎn)業(yè)鏈各方以開放心態(tài)共建標準、共享技術(shù)、共拓場景,多樣性算力將不再是分散的“孤島”,而是互聯(lián)互通的 “大陸”。
浪潮信息副總經(jīng)理趙帥強調(diào),開放計算社區(qū)的核心目標就是利用生態(tài)力量打破性能瓶頸,推動業(yè)務創(chuàng)新發(fā)展,這是一種系統(tǒng)化思維與應用價值導向。超節(jié)點架構(gòu)本質(zhì)上也是系統(tǒng)化思維的產(chǎn)物,它不是某一個點的突破,而是在現(xiàn)有技術(shù)、生態(tài)和成本約束下,從系統(tǒng)層面去打破芯片本身的性能邊界,最大化用戶價值。作為社區(qū)的一員,浪潮信息后續(xù)將向社區(qū)成員開放自研的超節(jié)點架構(gòu)設計以及PD分離框架,推動開放超節(jié)點架構(gòu)的發(fā)展。
展望未來:GW級AI數(shù)據(jù)中心驅(qū)動更緊密的跨社區(qū)協(xié)作
隨著AI計算需求的持續(xù)爆發(fā)式增長,單機柜功率將從當前的100+kW躍升至未來的1MW以上,AI數(shù)據(jù)中心的電力需求也將步入GW級。AI數(shù)據(jù)中心正在從“機柜級密度革命”邁向“數(shù)據(jù)中心級系統(tǒng)工程挑戰(zhàn)”,更需要全球產(chǎn)業(yè)鏈開放協(xié)同,優(yōu)勢互補,共同應對挑戰(zhàn)。
GW級AI數(shù)據(jù)中心的建設,首要考慮電力供給的問題,能源基礎好、電力成本低是重要的發(fā)展前提。在這一點上,中國具備顯著的能源基礎設施優(yōu)勢特別是新能源。數(shù)據(jù)顯示,2025年一季度新增裝機90%來自于可再生能源,全國可再生能源發(fā)電量達8160億千瓦時,約占全部發(fā)電量的35.9%。但能源優(yōu)勢并不意味著全部,GW級AI數(shù)據(jù)中心在中國的落地仍面臨諸多挑戰(zhàn),如開發(fā)更穩(wěn)定高效的全光互聯(lián)方案、更好的能效管理技術(shù)、更優(yōu)的基建模式等等,不僅需要產(chǎn)業(yè)鏈各個環(huán)節(jié)的協(xié)同創(chuàng)新,更需要社區(qū)間的跨社區(qū)協(xié)作,推動技術(shù)共享、產(chǎn)品開發(fā)、標準制定等方面的工作。
事實上,GW級AI數(shù)據(jù)中心對算力生態(tài)帶來的重要變革,已經(jīng)推動了跨社區(qū)合作的進程加快。目前,OCP正在籌備成立“GW級開放智算中心OCP中國社區(qū)小組”,結(jié)合中國在能源、算力基礎設施與供應鏈方面的需求與優(yōu)勢,推動AI開放系統(tǒng)戰(zhàn)略計劃在中國的落地。同時,OCP也在同OCTC積極合作,探討將OCP領先的AI基礎設施技術(shù)架構(gòu)、參考方案、前沿研究成果等在中國市場落地,在中國建立GW級AI數(shù)據(jù)中心的全球性標桿。
未來,開放計算技術(shù)大會將致力于打造全球開源開放聯(lián)合體,為數(shù)據(jù)中心產(chǎn)業(yè)鏈上下游搭建起全球鏈接協(xié)作平臺,推動不同國家和地區(qū)的開發(fā)者參與開放計算項目,加強產(chǎn)業(yè)鏈互聯(lián)互通和開放協(xié)作,推動全球供應鏈創(chuàng)新融合發(fā)展,進而增強社區(qū)的多元化和包容性。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )