21世紀經濟報道記者 張賽男 南京報道
ChatGPT帶火算力產業鏈,當市場還在熱議算力的商業化應用將在哪個行業率先落地時,鮮為人知的是,高校早已開啟了一場“算力革命”,賦能前沿學科的研究。
(資料圖)
據記者不完全統計,上海交通大學、清華大學、中南大學、南京大學,北京大學、江蘇大學、南方科技大學、廈門大學、青海大學等都已建設自己的算力中心。
近日,21世紀經濟報道記者走進南京大學高性能計算中心看到:一個個指示燈閃爍不停,機房內嗡嗡作響,數十個機柜緊密排列,上千臺服務器正在高效運轉。這座“超級大腦”正在為南大師生提供高效可靠的高性能計算資源和服務。
(圖為南京大學高性能計算中心內部)
早在2000年,南大就建設了第一臺高性能計算機,隨后進行了多次增建。2010年,高性能計算中心正式成立。但隨著科技飛速發展,學校師生對高性能計算的需求日益增長,南京大學的計算資源缺口依然很大,2019年-2022年中心擴容速度明顯加快。
高校作為基礎研究的主陣地,正扛起推進AI研發和應用的大旗,如何構建AI所需的超高算力并加速科研成果轉化早已提上日程。高性能計算中心,儼然成為高??蒲械臉伺?,悄然引領著潮水的方向。
科研創新基座
在政策支持下,近年來從國家到地方、再到企業都在布局數據中心集群,高校為什么還要建自己的計算中心?
這就不得不談科研所面臨的現實問題。“在使用其他超算中心的過程中,面臨著數據存取的困難。我們的老師都在學校里搞科研,最方便的自然是把數據計算完后拿到自己那里分析、處理。如果在遠端計算,要處理的數據量特別大,正常的網絡傳輸都要七、八天,如果是這樣的傳輸效率,可能我們的數據還沒傳到,其他科研組的計算結果就算出來了,你的科研工作就永遠比人家慢了一拍?!蹦暇┐髮W高性能計算中心高級工程師盛樂標博士對21世紀經濟報道記者表示。
2010年,南京大學高性能中心應運而生,是國內高校中較早成立的超算中心,旨在為全校各理工科院系的教師和學生提供高性能計算服務。發展至今,南京大學高性能計算中心已成為國內頂尖高校高性能計算中心之一,全系統共有33280個CPU核,理論浮點運算峰值1500萬億次/秒。
目前,高性能計算在南大科研中應用于多個領域,包括數據驅動磁流體力學模擬、量子力學與分子力學的混合計算、生物大分子全原子動力學模擬、系統仿真、新材料設計、中大尺度氣象模式模擬、新冠病毒相關研究等。
“高性能計算平臺在助力學校學科發展中,發揮了不可替代的重要作用?!蹦暇┐髮W高性能計算中心副主任周慶林表示,“僅2019至2021三年,高性能計算中心超算平臺就支持了超百篇卓越學科論文的發表,并支撐學校教師承擔三十多項國家重大科研項目。”
以高性能計算典型應用場景——行星物理環境模擬為例,受限于客觀條件,對行星內部環境和物質的實驗觀測、研究挑戰巨大,有必要采用理論模擬計算。依托南京大學高性能計算中心的高性能算力,物理學院師生研究了行星內部高壓下的新材料,且大幅提高了研究效率,目前相關成果已在Nature、Physics、PRX、NSR等國際一流學術刊物發表。
地質探測也是高性能計算的典型應用場景,中國石油集團東方地球物理公司數據中心原總工程師賴能和表示:“高性能計算與AI技術結合大幅提升了油氣勘探效率,同時企業與高校的合作,進一步促進了產學研用融合發展。”
“各個學科其實是類似的,計算資源越大,所能研究的科學問題就更多、可以做得更好。比如以前測試的精度是一公里,通過高性能計算能把精度做到10米;以前研究的維度是分子層次,現在能研究細胞層次,這些都是算力帶來的。”盛樂標對21世紀經濟報道記者說。
出于上述種種原因,算力中心建設在高校如火如荼。2021年,上海交通大學也啟用了高性能計算機群——“思源一號”,一度在該領域搶盡風頭。其總計算力達到6000萬億次/秒(雙精度),在中國高校高性能計算排名第一,算力超過哈佛、劍橋等國際名校。自2013年以來,“思源一號”累計服務一級學科30多個,支撐用戶發表高水平論文600多篇(其中CNS及其子刊47篇),為10多個學科提供了學科融合的計算服務。
軟硬件儲備和機遇
高性能計算中心(HPC,高性能計算)在高校如雨后春筍般興起,背后是軟硬件基礎設施建設的完善。從產業鏈角度看,HPC涉及的資源有算力芯片(GPU/CPU)、ICT整機設備領域(交換機、路由器、服務器、安全設備、WLAN等)、基礎電信運營、存儲、液冷、云計算及系統集成等。
市場人士認為,長期來看,以ChatGPT為代表的AI應用正快速發展,而軟端的迭代離不開硬件基礎設備的保障,AI數據中心內部的各類的硬件基礎設施環節有望充分受益。
近年來,無論是高校還是企業,都對高性能計算的需求不斷增加,其產業鏈的自主可控也越發受到關注。
“目前我國高性能計算發展取得了非常好的成績,中國TOP100高性能計算機平均能力比全球TOP500高出30%,其中自主研發的集群占95%,100臺集群中有42臺由聯想制造,中國高性能計算已經進入全球第一梯隊。” 賴能和介紹稱。前述提到的包括南京大學在內多個高校的高性能計算中心就由聯想幫助完成建設。
“在建造高性能計算系統的時候,聯想一直秉承開放融合的態度,不僅支持傳統的X86架構,還完成了對飛騰、海光等國產生態的支持?!?聯想高性能計算和人工智能主任技術顧問郝常杰介紹說,聯想目前已經具備了支持兩條高性能計算產品線和解決方案的能力。
回顧起搭建校級平臺的過程,郝常杰有諸多感慨:“會有些眾口難調,高校有不同的需求,比如希望能夠增加不同的配置,是用內存更大的、內存中等的還是夠用的?還有加速的節點、用幾路CPU去支撐各個學科的研究?我們一直在思考,怎樣在高校建一個綜合平臺去滿足各個學科不同的需求?!?/p>
在這個過程中,聯想摸出了一些經驗?!拔覀儠P注整個系統架構的情況,比如要使用高帶寬、低延遲、高速的網絡,在計算的部分我們要有普通的CPU計算節點、GPU的加速節點,或者增加人工智能的研究、登錄管理以及存儲系統等。”郝常杰說。
而隨著新興技術的不斷涌現,高性能計算也面臨著新的機遇和挑戰。中科院計算技術研究所、高通量計算機研究中心、處理器芯片重點實驗室高級工程師李明宇指出:“AI與算力網絡的發展給高性能計算帶來新的挑戰,比如各種模型、算法、開源項目快速發展,第三方庫更新頻繁,相互依賴關系復雜;算力需求和供給快速增長,跨站點算力調度需求大幅增長,環境配置和管理的復雜度與工作量也大大提升?!?/p>
“現在AI for science有了一些新的突破,無論是科研還是其他行業都會有很多機會?!崩蠲饔顚τ浾弑硎?,“從科研角度來說,一個最直接的變化就是,以前科研遇到的問題不太能解決了,但換AI以后可能就解決了,這對于搞科研的人來說非常值得嘗試。一旦嘗試就需要算力,這個需求就產生了,而這個量可能比以前更大。”
更多內容請下載21財經APP
責任編輯:
標簽: