【6.18】“青年科技工作者園地”第118次活動(dòng)_基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的高能物理數(shù)據(jù)熱度預(yù)測(cè)
講座內(nèi)容: 基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的高能物理數(shù)據(jù)熱度預(yù)測(cè)
主講人:程振京
時(shí)間:6月18日(周二)下午15:00
地點(diǎn):計(jì)算中心二樓會(huì)議室
報(bào)告簡(jiǎn)介:
高能物理計(jì)算是典型的數(shù)據(jù)密集型計(jì)算,每年需要分析PB級(jí)的海量物理數(shù)據(jù),對(duì)數(shù)據(jù)訪問(wèn)性能有著越來(lái)越高的要求。構(gòu)建統(tǒng)一命名空間的分級(jí)存儲(chǔ)系統(tǒng)方案已經(jīng)被廣泛采用。一般根據(jù)訪問(wèn)熱度不同將數(shù)據(jù)存儲(chǔ)于不同性能、不同價(jià)格的存儲(chǔ)設(shè)備上。當(dāng)數(shù)據(jù)熱度變化時(shí),再將數(shù)據(jù)遷移至合適的存儲(chǔ)層級(jí)。目前數(shù)據(jù)熱度預(yù)測(cè)廣泛采用基于人工經(jīng)驗(yàn)的啟發(fā)式算法,由于不同用戶計(jì)算模式的差異,預(yù)測(cè)準(zhǔn)確率較低。提出了一種借助LSTM深度學(xué)習(xí)算法,基于文件訪問(wèn)特征預(yù)測(cè)未來(lái)訪問(wèn)熱度的方法,作為分級(jí)存儲(chǔ)中數(shù)據(jù)遷移的依據(jù)。以高能物理實(shí)驗(yàn)LHAASO的真實(shí)數(shù)據(jù)為例做了對(duì)比測(cè)試,結(jié)果表明,在相同測(cè)試條件下,與已有預(yù)測(cè)模型相比,該模型具有更高的預(yù)測(cè)精度和更強(qiáng)的適用性。
附件下載: