高能所計(jì)算中心成立于1974年,第一臺(tái)計(jì)算機(jī)是當(dāng)時(shí)國(guó)內(nèi)最大的48位國(guó)產(chǎn)DJS-8(320)計(jì)算機(jī)。1984年開始建設(shè)北京正負(fù)電子對(duì)撞機(jī)(Beijing Electron-Positron Collider, BEPC)和北京譜儀(Beijing Spectrum),計(jì)算中心在國(guó)內(nèi)率先引進(jìn)了當(dāng)時(shí)國(guó)際先進(jìn)的DEC VAX-11/780計(jì)算機(jī),并在隨后的幾年連續(xù)進(jìn)口了5臺(tái)更為先進(jìn)的DEC VAX計(jì)算機(jī)并組成了計(jì)算機(jī)集群。北京譜儀于1994年升級(jí)為BESII,計(jì)算技術(shù)也從大型機(jī)(mainframe)發(fā)展到RISC工作站機(jī)群系統(tǒng),計(jì)算中心也應(yīng)計(jì)算技術(shù)的變化,先后購(gòu)買了12臺(tái)HP工作站,組成了BESII的數(shù)據(jù)處理和分析環(huán)境。90年代后期,由于PC機(jī)和百兆/千兆以太網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,特別是開放源碼的Linux操作系統(tǒng)出現(xiàn),并在互聯(lián)網(wǎng)技術(shù)的催生下,發(fā)展速度異常迅猛,很快進(jìn)入實(shí)用階段。計(jì)算中心于1998年開始研究和建設(shè)PC Farm,從每一個(gè)實(shí)驗(yàn)一個(gè)PC Farm到逐漸整合,形成了一個(gè)中心的計(jì)算環(huán)境。
目前本中心的計(jì)算集群是國(guó)內(nèi)最大的高能物理數(shù)據(jù)平臺(tái),包括登錄集群、計(jì)算集群、監(jiān)控報(bào)警系統(tǒng)、作業(yè)調(diào)度系統(tǒng)、分布式文件系統(tǒng)集群、磁帶管理系統(tǒng)、備份系統(tǒng)等核心組件,全部是在開源軟件和二次開發(fā)的基礎(chǔ)上建設(shè)和實(shí)現(xiàn)?,F(xiàn)在系統(tǒng)包括20000 個(gè) X86 架構(gòu)CPU核,100張NVidia GPU V100卡, 80GB/s訪問(wèn)帶寬的數(shù)據(jù)處理能力,以及服務(wù)于集群計(jì)算的20PB的全局共享磁盤存儲(chǔ),服務(wù)于數(shù)據(jù)長(zhǎng)期保存的20PB的磁帶存儲(chǔ)空間,年完成作業(yè)量超過(guò)4000萬(wàn)個(gè),平均計(jì)算時(shí)間超過(guò)9800萬(wàn)小時(shí),系統(tǒng)資源使用率達(dá)90%以上。除了面向高能物理的高吞吐率(HTC)數(shù)據(jù)密集型計(jì)算模式以外,系統(tǒng)還可以支持以格點(diǎn)QCD,分波分析,加速器模擬為代表的高性能計(jì)算(HPC),以及AI模型訓(xùn)練,內(nèi)存計(jì)算,志愿計(jì)算等多種計(jì)算和應(yīng)用模式。為了便于國(guó)際的合作和資源的共享,高能所計(jì)算中心還是一個(gè)WLGC(Wide LHC Computing Grid)的二級(jí)站點(diǎn)。中心數(shù)據(jù)處理平臺(tái)支持北京正負(fù)對(duì)撞機(jī)實(shí)驗(yàn)產(chǎn)生的數(shù)據(jù),中日(China-Japan)和中意(China-Italy)宇宙線實(shí)驗(yàn),中美(China-U.S)大亞灣中微子實(shí)驗(yàn),以及位于瑞士日內(nèi)瓦CERN的大型強(qiáng)子實(shí)驗(yàn)等的數(shù)據(jù)處理與分析。中心還為山東大學(xué)、中國(guó)科技大學(xué)、蘭州大學(xué)、北京航空航天大學(xué)等國(guó)內(nèi)高能物理研究機(jī)構(gòu)提供遠(yuǎn)程運(yùn)維服務(wù)。未來(lái)中心將通過(guò)分級(jí)作業(yè)調(diào)度、數(shù)據(jù)聯(lián)盟、邊緣計(jì)算等技術(shù),將這些分布式的計(jì)算資源整合成一個(gè)統(tǒng)一的高能物理計(jì)算平臺(tái),將計(jì)算服務(wù)覆蓋到整個(gè)中國(guó)高能物理研究領(lǐng)域,提高領(lǐng)域整體的資源利用水平和管理水平。同時(shí),我們還將根據(jù)高能所的戰(zhàn)略規(guī)劃,把服務(wù)拓展到射線科學(xué)計(jì)算、空間天文數(shù)據(jù)處理等新興的大科學(xué)計(jì)算領(lǐng)域,把計(jì)算中心建設(shè)成為一個(gè)多學(xué)科共享的支持多樣化科學(xué)應(yīng)用的數(shù)據(jù)處理平臺(tái)。