企業空間 采購商城 存儲論壇
華為全閃存陣列 IBM云計算 Acronis 安克諾斯 安騰普 騰保數據
首頁 > 全球超級計算機排行榜 > 正文

在Summit超級計算機上的揣流計算破世界紀錄

2019-11-17 23:05來源:中國存儲網
導讀:作為北京鳥巢、美國白宮、沙特皇宮等全球知名高規格場館的凈水設備供應商,以及眾多世界知名餐飲連鎖企業的凈水設備供應商,濱特爾始終堅信大眾的口碑才是品牌和產品最好的“廣告”。

喬治亞理工學院的研究人員使用一種新的湍流模擬算法,在Summit超級計算機上取得了世界紀錄的性能。

湍流是一種紊亂的流體運動狀態,是一個非常復雜的科學難題。湍流滲透到科學和工程領域的許多應用中,包括燃燒,污染物運輸,天氣預報,天體物理學等等。模擬湍流的科學家面臨的挑戰之一是,為了準確理解這一現象,必須捕獲各種尺度。這些規模可能跨越幾個數量級,并且可能難以在可用計算資源的限制內捕獲。

當與正確的科學代碼搭配使用時,高性能計算可以應對這一挑戰。但是,要以超出當前技術水平的問題規模模擬湍流,就需要與一流的異構平臺協同工作,進行新的思考。

由佐治亞理工學院航空航天工程和機械工程學教授PK Yeung領導的團隊使用其團隊的新代碼GPU(用于極端尺度湍流模擬(GESTS))執行了湍流的直接數值模擬(DNS)。DNS可以準確地捕獲各種規模的細節。今年早些時候,該團隊在Oak Ridge領導力計算設施(OLCF)上開發了針對IBM AC922 Summit超級計算機進行了優化的新算法。借助新算法,該團隊在每個時步上的掛鐘時間不到15秒,在超過6萬億個網格點上的性能達到了新的世界紀錄,在規模上超過了該領域的現有技術水平。問題。

預計該團隊在Summit上進行的模擬將闡明有關快速攪動湍流的重要問題,這將直接影響發動機和其他類型推進系統中反應流的建模。

GESTS是OLCF加速應用程序準備中心的計算流體動力學代碼,該中心是美國能源部(DOE)橡樹嶺國家實驗室的科學部用戶設施辦公室。GESTS的核心是一種基本的數學算法,可在三個空間方向上計算大規模的分布式快速傅立葉變換(FFT)。

FFT是一種數學算法,可計算信號(或場)從其原始時域或空間域到頻率(或波數)空間中的表示的轉換,反之亦然。在數學和科學計算中稱為“偽譜方法”的方法中,Yeung廣泛地應用了大量FFT,以精確求解流體動力學的基本偏微分方程Navier-Stokes方程。

使用基于CPU的大規模并行處理的大多數模擬會將3D解決方案域或計算流體流的空間量沿兩個方向劃分為許多長的“數據框”或“鉛筆”。但是,當Yeung的團隊在IBM的導師David Appelhans(IBM研究人員)于2017年底發起了OLCF GPU黑客馬拉松,該團隊提出了一個創新想法。他們將結合兩種不同的方法來解決該問題。他們將首先在一個方向上劃分3D域,在Summit的大內存CPU上形成多個數據“平板”,然后使用Summit的GPU在每個平板內進一步并行化。

該團隊確定了基本CPU代碼中最耗時的部分,并著手設計一種新算法,該算法將降低這些操作的成本,將可能出現的最大問題規模推向極限,并利用以數據為中心的獨特優勢全球開放式科學中功能最強大,最智能的超級計算機Summit的特點。

我們將該算法設計為分層并行性之一,以確保它在分層系統上能很好地工作。” Appelhans說。“我們在一個節點上最多放置兩個平板,但是由于每個節點都有6個GPU,因此我們將每個平板拆開,然后將這些單獨的片段放到不同的GPU上。”

過去,鉛筆可能已經分布在許多節點上,但是該團隊的方法利用了Summit的節點間通信及其大量的CPU內存來將單個節點上的整個數據板容納起來。

我們最初計劃在內存位于GPU上的情況下運行代碼,這將我們限制在較小的問題大小上。” “但是,在OLCF GPU黑客馬拉松上,我們意識到CPU和GPU之間的NVLink連接是如此之快,以至于我們實際上可以最大限度地利用每個節點512 GB CPU內存。”

這一實現促使團隊將部分主要代碼(內核)改編為GPU數據移動和異步處理,從而允許計算和數據移動同時發生。創新的內核改變了代碼,使團隊能夠以比以往更快的速度解決比以往更大的問題。

該團隊的成功證明,當代碼開發人員將異構體系結構集成到算法設計中時,即使是大型的,以通信為主導的應用程序也可以從世界上功能最強大的超級計算機中受益匪淺。

凝聚成成功

團隊成功的關鍵因素之一是佐治亞理工學院團隊長期擁有的領域科學專業知識與Appelhans的創新思維和對機器的深刻了解之間的完美契合。

對成就也至關重要的是OLCF的早期訪問Ascent和Summit開發系統,以及由Argonne和Oak Ridge共同管理的創新小說和對理論與實驗的計算(INCITE)計劃為Summit提供的百萬節點小時分配領導力計算設施,以及2019年的Summit早期科學計劃。

OLCF的工具開發人員Oscar Hernandez幫助團隊在整個項目中應對挑戰。這樣的挑戰之一就是弄清楚如何結合多個GPU在CPU上運行每個并行進程(遵循消息傳遞接口[MPI]標準)。通常,一個或多個MPI進程與一個GPU綁定在一起,但是該團隊發現,每個MPI進程使用多個GPU可使MPI進程發送和接收的消息數量比團隊最初計劃的數量少。Hernandez使用OpenMP編程模型,幫助團隊減少了MPI任務的數量,提高了代碼的通信性能,從而進一步提高了速度。

該項目的喬治亞理工學院博士生Kiran Ravikumar將在SC19的技術程序中介紹該算法的詳細信息。

團隊計劃使用該代碼進一步打入湍流之謎。將來他們還將在代碼中引入其他物理現象,例如海洋混合和電磁場。

該法規及其未來版本將為湍流科學的重大進步提供令人振奮的機遇,其普遍見解取決于在許多自然環境和工程環境中的湍流混合。”

相關出版物:K. Ravikumar,D。Appelhans和PK Yeung,“使用異步性對湍流進行極端尺度偽譜模擬的GPU加速”。論文將在丹佛SC19上發表。

資料來源:ORNL

繼續閱讀
關鍵詞 :
Summit
中國存儲網聲明:此文觀點不代表本站立場,如有版權疑問請聯系我們。
相關閱讀
產品推薦
頭條閱讀
欄目熱點

Copyright @ 2006-2019 ChinaStor.COM 版權所有 京ICP備14047533號

中國存儲網

存儲第一站,存儲門戶,存儲在線交流平臺

广西11选五走势图彩经网