為何要建設國家超算互聯網?國家超算互聯網如何實現算力資源統籌調度、賦能產業創新?
通過市場化的運營和服務體系,實現算力資源統籌調度
打開國家超算互聯網“商品廣場”,由復旦大學類腦智能科學與技術研究院開發的“數字孿生腦平臺”顯示在售。這個平臺整合了多模態的生物數據和先驗知識,利用超算集群計算資源,將相關數據與算法集成為一個數字孿生的腦模擬平臺,為腦科學與類腦智能研究提供服務支撐。用戶在國家超算互聯網上填寫使用申請表后,即可申請試用“數字孿生腦平臺”。詳情頁上,“商品說明”“服務與支持”“客戶案例”“商品評價”等信息一目了然。
在國家超算互聯網平臺上,科研人員、仿真工程師、人工智能研發人員可以像網絡購物一樣方便地購買和使用算力基礎資源、應用軟件、應用平臺、數據資產等,并按照軟件類型、算力、時長等付費。
超算,即超級計算或高性能計算,經常應用于高精尖科研領域,被視為科技突破的“發動機”。如何更好地發揮超算的性能、高效求解各類應用中的科學問題,是超算發展的關鍵。
近年來,隨著超算與人工智能、大數據等新技術持續融合,超算應用場景日益豐富,服務科學研究、產業發展的方方面面,成為科技創新和產業創新的重要驅動力。另一方面,算力已從單純以性能比拼,過渡到服務能力、計算應用、綠色低碳等新優勢的比拼,對超算環境和應用提出了更高的要求。
在此背景下,2023年4月,國家超算互聯網正式啟動建設,目標是突破現有單體超算中心運營模式,緊密連接供需方,通過市場化的運營和服務體系,實現算力資源統籌調度,以應對算力設施分布不均衡、接口不統一、應用軟件自主研發和推廣不足等問題,有效支撐原始科學創新、重大工程突破、經濟高質量發展等目標,成為支撐數字中國建設的“高速路”。
國家超算互聯網依托一體化的算力調度、數據傳輸、生態協作體系,實現算力供給、軟件開發、數據交易、模型服務等產業鏈各主體的緊密連接,構建市場化、互聯網化、服務化、標準化的高性能計算服務環境。經過近一年建設,國家超算互聯網工作取得了突破性進展,并完成了首階段的建設目標。
從“提供算力”向“提供服務”轉變,國家超算互聯網有望促使超算應用模式轉變。中國科學院院士、超算互聯網總體專家組組長錢德沛解釋道:“狹義上,國家超算互聯網通過高速網絡將全國眾多的超算中心連接起來,構建統一使用、對外服務的基礎設施。廣義上,則是通過互聯網的形式,方便更多用戶獲取資源。同時,軟件和服務也可以給更多人使用,實現計算資源、軟件資源、應用解決方案資源的深度整合,從根本上提高超算的應用水平。”
在超算互聯網總體專家組副組長、上海交通大學教授管海兵看來,我國超算發展經歷了硬件積累、軟件創新到高性能計算環境建設的發展階段,以互聯網思維來運營超算算力,把相關軟硬件、從業者和計算能力連接起來,能夠更好發揮超算作用,為經濟社會發展服務。
已迭代100多個版本,建立了大型的基礎服務平臺
超算中心與智算中心、云計算中心的應用場景有明顯差異。云計算中心即傳統數據中心,主要提供通用算力、大數據分析等服務,在數據存儲和虛擬化等方面具備優勢;智算中心則主要應用于人工智能、機器學習、圖像處理、語音識別等領域,這些應用需要快速迭代和優化模型,對計算效率要求較高;超算中心通常由大量的計算節點和高速互聯網絡組成,可同時進行大量并行計算任務,應用于大規??茖W計算、工程仿真、氣象預報等。
“很多的科學計算里面需要人工智能技術,很多人工智能應用也需要高精度、混合精度的計算。未來,單一精度的計算會變少,混合精度的計算會成為主流。多元融合、超智融合將是算力基礎設施發展的重要趨勢。”國家高性能計算機工程技術研究中心副主任曹振南說。
中國信息通信研究院副院長王志勤認為,過去的通用算力正逐漸向超算、智算、通用算力三種類型方向發展,“因此,分散化的算力如何通過更好的機制實現互聯互通,亟須一些新技術、新模式的探索。”
曹振南介紹,架構上,國家超算互聯網可分為3層。最底層是匯聚各個不同算力中心的異構算力資源;中間通過一體化服務與調度平臺,進行分布式異構算力資源調度,與應用服務化封裝、發布、管理,包括面向不同用戶、不同資源的各類管理、交易、作業等;最上層則建立了算力應用商店,為用戶提供各種算力、軟件、數據、模型、源碼、技術等。
國家超算互聯網建設過程中,多家國家/區域超算中心、應用軟件單位、支撐單位,以及從事超算相關領域的企業和高校院所等組織成立了超算互聯網聯合體。成員單位從成立時的22家擴展到現在的128家。聯合體還成立了工作組和研發團隊,開展相關設計研發工作。
“同時,我們也希望用互聯網的模式‘共創’整個國家超算互聯網。在研發過程中,有500多個共創者參與進來,進行軟件打包、適配、軟件應用設計等工作,來自各個行業的1000多位‘體驗官’給我們提出了很多寶貴意見。一年來,國家超算互聯網平臺已迭代100多個版本,形成10個主要模塊和100萬行以上的源代碼,建立了大型的基礎服務平臺。”曹振南說。
曹振南表示,面向未來,國家超算互聯網要建立更多元的算力服務模式和更多樣的資源部署模式。“我們希望為用戶提供‘一點接入、隨取隨用’的服務。用戶無需關注算力類型、地理位置、軟件歸屬,甚至不需要知道誰在為你服務。”
建立良好的商業模式,使更多行業和領域受益于超算
近年來,我國在超算互聯網領域已經開展了一些探索和實踐。
比如,國家超算無錫中心聯合國家超算廣州中心等超算中心,以及清華大學、之江實驗室等應用單位開展了超算互聯網技術體系和應用模式研究;山東上線超算互聯網工程,以實現數據和算力的互聯互通,打造“山東算網”。2023年10月,工業和信息化部等6部門印發了《算力基礎設施高質量發展行動計劃》,提出“探索構建布局合理、泛在連接、靈活高效的算力互聯網”。
中國科學院院士鄂維南認為,國家超算互聯網應用生態的打造,有利于降低超算應用門檻,加快科學計算和人工智能等技術的發展。華大生命科學研究院生物信息首席科學家黎宇翔表示,有了國家超算互聯網,相當于打通了算力服務的“最后一公里”,可以基于自己的平臺跟國家超算互聯網結合,進行跨區域的數據傳輸和計算,選擇最合適的算力類型,適配具體的應用。
在國家超算天津中心黨組書記、應用研發首席科學家孟祥飛看來,經過多年發展,我國超算研制和建設已經規?;?,形成了廣泛的超算算力布局能力。“從算力供給側來說,超算‘微—宏’架構差異越來越大,可擴展性、可靠性、可編程性等方面也面臨巨大的挑戰。新的數據范式的發展,使得超級計算機要兼顧數值計算、數據處理等各方面的應用需求,它的支撐能力也面臨著巨大的挑戰。從需求側來說,重大科學與工程領域面臨巨大的多元化算力需求,而多學科交叉、多領域團隊協同的系統性創新,底層需要有一個綜合能力的信息化載體、算力載體來支撐。”
中國工程院院士、清華大學教授鄭緯民認為,推動國家超算互聯網平臺再上新臺階,一是要提升平臺的互聯帶寬,二是要將超算節點之間的互通做好,統一編程框架,使一個程序可以在不同機器上運行,三是要進一步挖掘超算互聯網平臺的新應用。
錢德沛說:“構建支撐應用的國家超算互聯網,不單要做網絡,更重要的是建立超算互聯網平臺上各角色之間良好的商業模型,鼓勵更多的力量投入超算應用事業,使更多行業和領域受益于超算,讓超算資源得到充分應用,成為支撐國家創新發展的基礎設施。”
標簽: