在日前舉辦的OCP ChinaDay大會上,業界首個面向AIGC(生成式人工智能)的《開放加速規范AI服務器設計指南》(以下簡稱指南)正式發布。
浪潮信息服務器產品線總經理趙帥介紹,該指南面向AIGC實際應用場景,細化完善了開放加速規范AI服務器的設計理論和方法,明確了硬件設計參考、管理接口規范和性能測試標準等,將為新興的AI芯片創新提供有力的系統平臺支撐,幫助AI芯片企業縮短研發和系統適配周期,大大減少開發費用,更快釋放算力價值,有效加速多元算力產業發展,助力AIGC時代的AI計算產業跨越“創新”鴻溝。
加速開放計算產業發展,系統級產品創新是關鍵。在基礎硬件、基礎軟件、核心應用、上層生態間建立起統一的技術路線及標準API接口,將加速器模塊標準化,簡化人工智能基礎架構設計,能夠有效縮短硬件開發和產業賦能周期。
(資料圖片僅供參考)
當前,以大模型為代表的AIGC熱潮帶來了AI算力需求的爆發式增長。更豐富的算力資源成為人工智能競爭的核心基石??梢哉f,計算力就是生產力,智算力就是創新力。IDC預計,全球 AI計算市場規模將從2022年的195億美元增長到2026年的346.6億美 元,其中生成式AI計算市場規模將從 2022年的8.2億美元增長到2026年的 109.9億美元。生成式AI計算占整體 AI計算市場的比例將從4.2%增長到 31.7%。
AIGC技術創新是一項復雜的系統工程,需要基于海量數據集,在擁有成百上千加速卡的AI服務器集群上對千億級參數的AI大模型進行分布式訓練,這對算力資源的規模提出了極高的要求,也對算力系統設計帶來了新的挑戰,要求單機具有更高的擴展性、集群具有更高的加速比,由此對卡間互聯、網絡帶寬和延遲提出了更高的要求。
隨著AI大模型、超大模型的不斷發展,芯片公司相繼推出了新形態的AI加速卡來支持更高的功耗和更強大的卡間互聯能力。當前,隨著數據中心用戶對AI計算力需求的不斷攀升,全球已有上百家公司投入新型AI芯片的研發與設計,人工智能芯片發展呈現多元化趨勢。但各廠商采用不同技術路線,導致產業面臨硬件體系孤島和生態割裂問題,帶來算力產業發展高成本和低靈活性的問題。
“統一開放的產業標準能有效降低技術獲取成本,推動創新技術普及,為產業發展賦能提速?!崩顺毙畔I&HPC產品線高級產品經理張政說。
據了解,以OCP為代表的開放計算項目,推出全新的、全球化的產業協作模式,通過消除技術壁壘,加快計算產業創新的速度。其中,OCP的OAI(開放加速器基礎設施)開放標準極大地激發了AI計算基礎設施集成的創新。目前,已有包括浪潮信息、Intel、燧原科技等10+系統和芯片廠商,通過開放、合作為市場推出10余款符合OAM標準的開放加速AI服務器,并在全球范圍內開展成功實踐,充分論證了技術可行性,構建起茁壯的生態體系。
張政介紹,早在2019年OCP剛成立OAI小組時,浪潮信息作為主導的核心成員之一,牽頭組織制定了UBB、OAM(云原生應用)等規范,此后又發布了業界首個開放加速參考系統MX1。浪潮信息還協同合作伙伴,共同完成了早期OAM的技術驗證和積累,并發布了首款OAM服務器,將開放加速真正快速投入到產業應用中。在產業化落地的過程中,浪潮信息積累了很多經驗,并總結轉化從而形成《開放加速規范AI服務器設計指南》,以加速培育產業生態。
“事實上,我們也是國內最早做AI加速卡間高速互連技術的企業,對于如何構建大規模的訓練系統、如何加速AI模型訓練,我們有豐富的經驗。浪潮信息AI服務器在市場規模和技術方面都有著領先的優勢。”趙帥說。
據了解,開放加速計算的硬件架構正是為超大規模深度神經網絡模型并行計算而生,天然適用于AIGC大模型訓練。然而,當前開放計算技術推向產業落地的過程中,依然存在大量的定制化工作以及現有OAI標準未能完全覆蓋的領域。因此,浪潮信息基于豐富的開放加速計算工程實踐和產品歷程,發布面向AIGC的指南,提出四大設計原則、全棧設計方法,旨在幫助社區成員更快更好地開發符合開放加速規范的AI加速卡,并大幅縮短與AI服務器的適配周期,為用戶提供最佳匹配應用場景的AI算力產品方案。
其中,四大設計原則為應用導向原則、多元開放原則、綠色高效原則和統籌設計原則?;谏鲜鲈O計原則,以提高適配部署效率、提高系統穩定性、提高系統可用性為目標,《指南》進一步歸納總結出開放加速規范AI服務器的設計方法,即多維協同設計、全面系統測試、性能測評調優。
業內人士認為,開放加速規范的AI服務器可為AI芯片創新提供成熟的系統平臺支撐,幫助AI芯片廠商聚焦于芯片創新研發,實現更科學合理的產業分工,避免封閉技術生態存在的單點單線風險,推動智算產業生態健康發展;另一方面,基于開放加速工程實踐和成熟計算平臺總結的設計指南,可加速有競爭力的AI芯片的創新研發和落地部署,有效節省研發投入并縮短開發適配周期50%以上,為用戶提供可以用來支撐AIGC大模型訓練的多元算力解決方案,以多元算力之道破解當下AI算力供需難題。(經濟日報記者 黃鑫)
標簽: