搜索新聞

NVIDIA Hopper GPU 架構(gòu)采用全新 DPX 指令將動態(tài)編程速度提升 40 倍

來源：投影時(shí)代　更新日期：2022-03-28 作者：佚名

商顯市場最大的看點(diǎn)何在年度評選盛典獲獎(jiǎng)揭曉 LED及大屏商顯年終總結(jié)

動態(tài)編程算法應(yīng)用于醫(yī)療健康、機(jī)器人、量子計(jì)算、數(shù)據(jù)科學(xué)等多個(gè)領(lǐng)域。

3 月 23 日在 GTC 上發(fā)布的 NVIDIA Hopper GPU 架構(gòu)利用全新 DPX 指令，將動態(tài)編程速度提高多達(dá) 40 倍。動態(tài)編程是一種應(yīng)用于基因組學(xué)、量子計(jì)算、路線優(yōu)化等領(lǐng)域算法中，用以解決問題的技術(shù)。

DPX 是 NVIDIA H100 GPU 的內(nèi)置指令集，可幫助開發(fā)者編寫代碼，用以提高多個(gè)行業(yè)中動態(tài)編程算法的速度，從而加速疾病診斷、量子模擬、圖形分析和路線優(yōu)化的工作流程。

何為動態(tài)編程？

動態(tài)編程是一種起源于 20 世紀(jì) 50 年代的熱門技術(shù)，它通過遞歸和記憶化這兩種關(guān)鍵技術(shù)來解決復(fù)雜問題。

遞歸是指將問題分解為較簡單的子問題，達(dá)到節(jié)省時(shí)間和計(jì)算量的目的。而記憶化則負(fù)責(zé)存儲這些子問題的答案，這些答案在解決主問題時(shí)會被重復(fù)使用多次。記憶化可提高效率，因此在主問題稍后需要這些答案時(shí)無需重新計(jì)算子問題。

與 NVIDIA Ampere 架構(gòu) GPU 相比，DPX 指令在 NVIDIA H100 GPU 上將動態(tài)編程算法的速度提升了 7 倍之多。在搭載四塊 NVIDIA H100 GPU 的節(jié)點(diǎn)中，速度還可以進(jìn)一步提升。

用例涵蓋醫(yī)療健康、機(jī)器人、量子計(jì)算、數(shù)據(jù)科學(xué)

動態(tài)編程通常用于許多優(yōu)化、數(shù)據(jù)處理和組學(xué)算法中。迄今為止，大部分開發(fā)者都已在 CPU 或 FPGA 上運(yùn)行了此類算法，而 NVIDIA Hopper GPU 上，借助 DPX 指令，可實(shí)現(xiàn)大幅加速。

組學(xué)

組學(xué)涵蓋一系列生物領(lǐng)域，包括基因組學(xué)（側(cè)重于 DNA）、蛋白質(zhì)組學(xué)（側(cè)重于蛋白質(zhì)）和轉(zhuǎn)錄組學(xué)（側(cè)重于 RNA）。這些領(lǐng)域?yàn)榧膊⊙芯亢退幬镅邪l(fā)等依賴于算法分析（可通過 DPX 指令加速）的關(guān)鍵工作提供了依據(jù)。

例如，Smith-Waterman 和 Needleman-Wunsch 動態(tài)編程算法用于 DNA 序列比對、蛋白質(zhì)分類和蛋白質(zhì)折疊之中。這兩種算法均使用評分的方法來測量不同樣本基因序列的比對情況。

Smith-Waterman 可生成高度準(zhǔn)確的結(jié)果，但與其他比對方法相比，需消耗更多計(jì)算資源和時(shí)間。在搭載四塊 NVIDIA H100 GPU 的節(jié)點(diǎn)上使用 DPX 指令時(shí)，科學(xué)家可將此進(jìn)程加快 35 倍，實(shí)現(xiàn)實(shí)時(shí)處理。其中，堿基識別和比對工作的速度與 DNA 測序相同。

這種加速將有助于全球各地的醫(yī)院普及基因組分析，讓科學(xué)家朝著為患者提供個(gè)性化醫(yī)療的方向邁進(jìn)。

線路優(yōu)化

無論是行走于倉庫這樣動態(tài)化環(huán)境中的自主機(jī)器人，還是需要將數(shù)據(jù)傳輸?shù)接?jì)算機(jī)網(wǎng)絡(luò)中多個(gè)接收端的發(fā)送者，都需要為多個(gè)移動部件找到最優(yōu)線路，這一點(diǎn)至關(guān)重要。

為了解決這一優(yōu)化問題，開發(fā)者使用 Floyd-Warshall 動態(tài)編程算法來尋找地圖或圖形中所有成對目的地之間的最短距離。在搭載四塊 NVIDIA H100 GPU 的服務(wù)器中，與傳統(tǒng)的雙插槽 CPU 服務(wù)器相比，F(xiàn)loyd-Warshall 將速度提升了 40 倍之多。

結(jié)合 NVIDIA cuOpt AI 物流軟件，這種線路優(yōu)化加速可用于工廠、自動駕駛汽車中的實(shí)時(shí)應(yīng)用或抽象圖形中的地圖構(gòu)建和線路算法。

量子模擬

借助 DPX 指令，其他大量動態(tài)編程算法均可在 NVIDIA H100 GPU 上實(shí)現(xiàn)加速。量子計(jì)算領(lǐng)域前景廣闊。在量子計(jì)算中，量子模擬的張量優(yōu)化算法會使用動態(tài)編程。DPX 指令可以幫助開發(fā)者加快識別正確張量縮并順序的過程。

SQL 查詢優(yōu)化

另一個(gè)潛在應(yīng)用領(lǐng)域是數(shù)據(jù)科學(xué)。使用 SQL 編程語言的數(shù)據(jù)科學(xué)家通常需要在一組表上執(zhí)行多次“合并”運(yùn)算。動態(tài)編程有助于找到這些合并的最佳順序，這通�？梢怨�(jié)省大量執(zhí)行時(shí)間，從而加快 SQL 查詢速度。

返回投影機(jī)頻道首頁