【環球網科技報道】6月27日,國內高校最大的云上科研智算平臺CFFF(Computing for the Future at Fudan)在復旦大學正式上線。這臺為發現和解決復雜科學問題而建的科研“超級計算機”由復旦大學與阿里云等共同打造,以先進的公共云模式提供超千卡并行智能計算,支持千億參數的大模型訓練——這在國內高校中尚屬首例,也領先于斯坦福大學等國際知名高校 。
【資料圖】
延續復旦大學“博學而篤志,切問而近思”的校訓,CFFF平臺由面向多學科融合創新的AI for Science智能計算集群“切問”一號和面向高精尖研究的專用高性能計算集群“近思”一號兩部分組成。
復旦大學浩清教授、人工智能創新與產業研究院院長漆遠介紹,基于百G高速數據傳輸網和阿里云全球領先的大規模異構算力融合調度技術、分級存儲技術、AI與大數據一體化技術,部署在復旦校內的“近思”一號和托管在1500公里外阿里云烏蘭察布數據中心的“切問”一號連成了一臺真正意義上的“超級計算機”,復旦四校區的所有實驗設備都能高速接入,做到異構算力統一管理,計算任務統一調度,滿足不同應用場景下的科學智能研究與應用需求。
位于“東數西算”節點上的阿里云烏蘭察布數據中心,通過飛天智算平臺的公共云模式對外提供智能計算服務。
2022年,阿里云發布了飛天智算平臺,并啟動烏蘭察布數據中心等兩座超大規模智算中心,為科研、公共服務和企業機構,提供強大的智能計算服務,可將計算資源利用率提高3倍以上,AI訓練效率提升11倍,推理效率提升6倍。
據介紹,智算中心并不是簡單把配置先進制程芯片的服務器連接起來就能實現高性能算力。一個很關鍵的指標就是損耗。智能計算在這個方面,難度更大。相比通用型計算,智能計算需要海量數據進行訓練,在數據遷移、分布式訓練等環節損耗尤其嚴重,傳統智算中心達到一定規模之后,增加算力資源反而會降低算力輸出的能力,千卡以上規模的算力輸出最低往往僅有40%左右。但阿里云通過體系化的核心技術自研,以飛天智算平臺作為輸出,大幅降低了智能算力的損耗。
漆遠表示,有賴于公共云模式,跑在CFFF平臺上的項目可享受到超千卡并行的智能算力,千卡并行的有效算力達到行業領先的92%,可拓展性達到萬卡,萬卡并行有效算力也可達90%。
同時,公共云更加低碳和綠色。阿里云綠色數據中心技術結合烏蘭察布當地天然的氣候優勢,CFFF平臺可實現平臺年平均PUE小于1.2,每年可節省總電力超過2000千瓦,節省電費500萬元,年均節碳量達15噸。
目前,CFFF平臺上的第一個科研成果已經誕生。復旦大學人工智能創新與產業研究院李昊團隊近期發布了45億參數量的中短期天氣預報大模型,預測效果在公開數據集上首次達到業界公認的ECMWF(歐洲中期天氣預報中心)集合平均水平,并將預測速度從原來的小時級縮短到了3秒內。
“基于CFFF平臺的千卡并行智能計算,這樣一個規模的大模型只用一天就完成了訓練。傳統的計算平臺是很難做到的。”李昊說。
這也是CFFF平臺上孕育出的第一個大模型。金力表示,復旦希望基于CFFF平臺建成一批具有世界級影響力的科學大模型,例如生命科學大模型、材料科學大模型、大氣科學大模型、集成電路大模型等。
未來,CFFF平臺還將持續擴大其算力規模,并向復旦校外的科研機構、高校、醫院、高科技企業等開放。當天,面向全球科研人員的首屆世界科學智能大賽也宣布正式啟動,大賽設置生命科學、量子化學等五大賽道,CFFF平臺將為參賽隊伍提供免費訓練算力,并以更普惠的算力長期支持部分科研項目。
免責聲明:本文不構成任何商業建議,投資有風險,選擇需謹慎!本站發布的圖文一切為分享交流,傳播正能量,此文不保證數據的準確性,內容僅供參考
關鍵詞: