用戶希望構(gòu)建高性能計算系統(tǒng),提高系統(tǒng)設計和分析的能力,希望在技術(shù)改造中購置運行穩(wěn)定、技術(shù)先進、性能優(yōu)異,易于擴充和管理的高性能計算環(huán)境來滿足氣動力計算、結(jié)構(gòu)分析及系統(tǒng)仿真等應用的需要。要求系統(tǒng)的建立要滿足:
? 先進性:選擇代表業(yè)界先進水平和全球主流趨勢的軟硬件平臺產(chǎn)品,使之不僅能夠滿足高性能計算中心目前業(yè)務的需要,還能適應未來技術(shù)發(fā)展的趨勢和需要。
? 靈活性:根據(jù)用戶對解決大問題和同時運行多個中小型任務的綜合需求,優(yōu)化系統(tǒng)資源配置比例,實現(xiàn)最大的應用靈活性。
? 可擴展性:在設計上充分考慮到可擴展性需求,提供具有最高可伸縮性的系統(tǒng),并保護用戶現(xiàn)有的投資。
? 穩(wěn)定性:整體系統(tǒng)確保穩(wěn)定、高效、連續(xù)地運營,能夠支持全天24 小時的連續(xù)運行需求。
? 開放性:系統(tǒng)方案采用開放標準,開放結(jié)構(gòu),開放系統(tǒng)組件和開放用戶接口。充分滿足用戶投資保護和業(yè)務擴展、系統(tǒng)維護等方面的需求。
? 高管理性:建立統(tǒng)一高效的資源管理系統(tǒng),對所有計算機系統(tǒng)資源進行統(tǒng)一監(jiān)控與管理,以集中統(tǒng)一的管理方式,高效率、反應靈敏的技術(shù)服務機制,標準化、自動化的管理流程達到提供優(yōu)質(zhì)的資源管理服務,更好的為中心的業(yè)務發(fā)展服務。
方案架構(gòu):
計算機系統(tǒng)介紹
計算系統(tǒng)整體包含3箱TC4600E刀片計算集群,共包含30片雙路計算節(jié)點。其中雙路計算節(jié)點每臺配置2顆Intel E5-2680v4的CPU,配置64GB內(nèi)存,計算峰值為32.256萬億次每秒;高性能計算應用最為核心的需求仍然是計算能力,高性能計算機峰值計算能力代表著高性能計算機的整體處理能力,而對于大部分的高性能計算應用,對計算資源的海量需求仍然是最為迫切和直接的需求。
存儲系統(tǒng)介紹
本方案存儲系統(tǒng)為在之前老集群上面擴容3個數(shù)據(jù)存儲節(jié)點,每個節(jié)點配置22塊4TB的硬盤以及2塊480GB的SSD硬盤,此外,配置32塊4TB的硬盤放在之前未滿配的存儲節(jié)點上,因此本次新增存儲系統(tǒng)的容量為394TB,系統(tǒng)管理、登陸、計算節(jié)點等客戶端通過FDR InfiniBand網(wǎng)絡訪并行存儲系統(tǒng)。
網(wǎng)絡系統(tǒng)介紹
本系統(tǒng)方案采用目前業(yè)界最高性能的56Gb/s InfiniBand FDR高速網(wǎng)絡,用作并行計算程序的計算網(wǎng)絡以及并行存儲系統(tǒng)的存儲網(wǎng)絡。
系統(tǒng)配置1臺模塊化FDR InfiniBand交換機,配置36個FDR端口,實現(xiàn)系統(tǒng)節(jié)點之間的56Gb/s FDR線速交換。系統(tǒng)全部線纜采用光纖線纜,相比于銅纜,光纖線纜連接距離更長,不易折損,更容易布線和維護,線纜故障時,可方便的進行替換
軟件系統(tǒng)介紹
方案提供完備的集群系統(tǒng)軟件,包括:節(jié)點Linux操作系統(tǒng); Gridview集群操作系統(tǒng),提供系統(tǒng)監(jiān)控、管理、告警、統(tǒng)計、作業(yè)調(diào)度等功能和組件;GNU、Intel等編譯環(huán)境,BLAS、LAPACK、FFTW、Intel MKL等常用數(shù)學函數(shù)庫,OpenMP及MPI并行開發(fā)環(huán)境,以及其它相關(guān)的HPC開發(fā)運行環(huán)境;