4月12-14日,在 2017 InfoComm 中國國際視聽集成設(shè)備與技術(shù)展覽會上,全球視覺計算行業(yè)領(lǐng)軍企業(yè) NVIDIA (英偉達(dá)) 攜手麗臺科技展示了發(fā)布不久的基于 Pascal™ 架構(gòu)的 Quadro 系列顯卡結(jié)合 VR 虛擬現(xiàn)實(shí)以及最先進(jìn)的全方位多屏數(shù)字標(biāo)牌解決方案!
Pascal™ 架構(gòu)的全新 NVIDIA Quadro 產(chǎn)品陣容包括 GP100、P6000、P5000、P4000、P2000、P1000、P600 和 P400 等,能夠助力數(shù)百萬的工程師、設(shè)計師、研究人員和藝術(shù)家! 它們能夠?qū)⑴_式工作站轉(zhuǎn)變?yōu)榫哂型黄菩阅芰Φ某売嬎銠C(jī),并為不同行業(yè)的專業(yè)任務(wù)提供保障。與上一代產(chǎn)品相比,新 Quadro 產(chǎn)品不僅具有超快速內(nèi)存,而且速度最多可以提升兩倍(基于SPECviewperf 12 基準(zhǔn)的計算結(jié)果)。
Pascal™ 架構(gòu)視覺計算平臺有以下特點(diǎn):
● 統(tǒng)一仿真、HPC、渲染和設(shè)計 – GP100 將前所未有的雙精度性能與 16GB 的高帶寬內(nèi)存(HBM2)相結(jié)合,因此用戶可以在設(shè)計過程中進(jìn)行仿真,并以前所未有的速度采集逼真的多物理場仿真。客戶能夠?qū)蓚 GP100 GPU 與 NVLink™ 技術(shù)相結(jié)合,并擴(kuò)展到 32GB 的 HBM2,以在單一工作站上創(chuàng)建龐大的可視化計算解決方案。
● 探索深度學(xué)習(xí) – GP100 提供超過 20 TFLOPS 的半精度計算,可謂在 Windows 和 Linux 環(huán)境中進(jìn)行深度學(xué)習(xí)的理想開發(fā)平臺。
● 將VR集成到設(shè)計和仿真工作流程中 – VR 認(rèn)證的 Quadro GP100 和 P4000 具有創(chuàng)建詳細(xì)、逼真、沉浸式環(huán)境的能力,能夠大規(guī)模實(shí)現(xiàn)更加宏大、更加復(fù)雜的設(shè)計體驗(yàn)。
● 盡享照片級真實(shí)感設(shè)計的優(yōu)勢 – 基于Pascal™架構(gòu)的 Quadro GPU 渲染照片級真實(shí)感圖像的速度為 CPU 的 18 倍 。
● 創(chuàng)建廣闊的可視化工作區(qū) – 可在多達(dá)四個 5K 顯示器上以高分辨率和 HDR 顏色顯示數(shù)據(jù)。
● 經(jīng)濟(jì)高效地構(gòu)建超高分辨率及多顯示屏配置 – 通過將多達(dá) 8 個 P4000 GPU 和兩個 Quadro Sync II 顯卡相結(jié)合,可通過單一機(jī)箱實(shí)現(xiàn)多達(dá) 32 個 4K 顯示器的配置。
其中,GP100 作為該系列的旗艦產(chǎn)品,被科技媒體和粉絲們稱為超當(dāng)量核彈。
GP100 基于 Pascal™ 架構(gòu),匹配 16GB HBM2 顯存,單精度 CUDA 核心數(shù) 3584 個,雙精度 CUDA 核心數(shù) 1792 個,半精/單精/雙精浮點(diǎn)運(yùn)算性能分別是 20TFLOPS、10TFLOPS 和 5TFLOPS,帶寬高達(dá) 720GB/s,功耗 235W 。同其他新發(fā)布的專業(yè)卡一樣,它的性能提升也是全方面的(比如同步多重投影、VRWorks、Iray VR),同時還強(qiáng)化了虛擬化、Sync II、雙路NVlink等。
這也是 NVlink 首次在 Windows 系統(tǒng)上獲得支持,此前僅僅用于 IBM Power8 系統(tǒng)和基于 Linux 的 DGX-1,帶寬最高 80GB/s。
GPU 在 CAE 中的應(yīng)用
大會現(xiàn)場,同期舉辦了新品媒體發(fā)布會,NVIDIA 專業(yè)可視化業(yè)務(wù)高級總監(jiān) Sandeep Gupte 出席并闡述了 GPU 在 CAE 中的應(yīng)用,他表示:“對于這部分用戶,大部分是使用類似 Ansys、ABAQUS 等分析軟件求解復(fù)雜工程和產(chǎn)品的結(jié)構(gòu)力學(xué)性能。大規(guī)模的數(shù)據(jù)計算往往讓設(shè)計分析的過程十分漫長,而如果使用 CPU+GPU 加速的方案將會大大的節(jié)省運(yùn)算時間。”
NVIDIA 專業(yè)可視化業(yè)務(wù)高級總監(jiān) Sandeep Gupte
Sandeep 舉了個實(shí)際的例子,在現(xiàn)場一個集成了一張 GP100 的工作站里,工作人員使用 ABAQUS 對一個模型進(jìn)行了 470 萬的網(wǎng)格劃分和計算,類似這樣大規(guī)模的計算,往往需要運(yùn)行數(shù)十個小時甚至是數(shù)十天才能完成。Sandeep 表示相比僅使用 CPU 計算的方案,GPU 加速可以將計算時間將縮短為原來的1/3。
GPU 在真實(shí)物理渲染(PBR)上的應(yīng)用
在圖形渲染方面,英偉達(dá)中國區(qū)銷售總監(jiān)何猶卿表示,目前主流的渲染器都已經(jīng)在做 GPU 加速平臺,因?yàn)橐粠?4K 的電影畫面,如果還使用 CPU 渲染,需要 288 小時,而用GPU渲染只需要 3 個多小時。
GPU 在深度學(xué)習(xí)上的應(yīng)用
在深度學(xué)習(xí)領(lǐng)域,也是高性能 GPU 大展拳腳的地方,近年來深度學(xué)習(xí)的大發(fā)展除了科學(xué)家們孜孜不倦的學(xué)術(shù)探索外,和 GPU 運(yùn)算能力的突飛猛進(jìn)也密切相關(guān)。英偉達(dá)CEO黃仁勛曾表示:“計算機(jī)科學(xué)家綜合 Yann LeCun 的卷積神經(jīng)網(wǎng)絡(luò)、Geoff Hinton 的反向傳播算法,以及 Stochastic 的梯度下降訓(xùn)練法,加上吳恩達(dá) (Andrew Ng) 對 GPU 的大規(guī)模應(yīng)用,來加快深度神經(jīng)網(wǎng)絡(luò) (DNN) 的運(yùn)算速度,才促進(jìn)「深度學(xué)習(xí)」這項(xiàng)現(xiàn)代人工智能技術(shù)出現(xiàn)大爆炸般的發(fā)展局面。”
對于人工智能未來將對設(shè)計工作產(chǎn)生的影響,Sandeep 介紹了一種叫做生成式制造流程的人工智能概念設(shè)計方法。比如設(shè)計者要設(shè)計一把椅子,一般情況下需要通過 CAD 軟件設(shè)計出兩三個方案,然后交由決策者選擇。而有了人工智能參與后,設(shè)計者僅需提出邊界條件,例如承重多少,自重多少,尺寸如何等等,人工智能就可以自動生成出上百種的設(shè)計方案供決策者挑選,這不但有助于遴選出最佳的設(shè)計方案,還能大大的縮短設(shè)計的周期。
GPU 在 VR 上的應(yīng)用
在 VR 的應(yīng)用方面,為消費(fèi)級玩家所熟知的 GeForce 系列更多是針對個人娛樂的應(yīng)用,而 Quadro 系列則是面向?qū)I(yè)級的任務(wù)。如果僅僅是游戲,即便畫面的真實(shí)感和準(zhǔn)確性有些許偏差,也不會造成太嚴(yán)重的后果。但是如果是在工作決策中使用,那么就要求畫面盡可能的逼真,這時候就需要 Quadro 系列顯卡和 Iray VR 了。
據(jù) Sandeep 介紹, Iray 是 NVIDIA 的一款逼真的渲染解決方案,現(xiàn)已許可給 Dassault Systèmes 和 Autodesk 等軟件廠商。 利用 Iray 渲染技術(shù),連接至 Quadro 視覺計算設(shè)備(VCA)后,就可以享受逼真的渲染體驗(yàn)。 把多個 Quadro VCA 結(jié)合到一起后,基于光場實(shí)時計算,操作模型或場景時還能夠捕捉到細(xì)微的光線和反射。
QUEST 計劃
Sandeep 還提到英偉達(dá)首次在國內(nèi)推出了 QUEST 計劃(Quadro Embedded System Program),即基于 Quadro 的嵌入式系統(tǒng)計劃,針對高性能嵌入式系統(tǒng)的開發(fā)者,開發(fā)企業(yè)可以申請加入此計劃,英偉達(dá)將和他們合作設(shè)計適用于他們解決方案的 GPU。除此之外,英偉達(dá)還會提供設(shè)計包(Design Kit)、SDK、樣本代碼、訓(xùn)練等。該項(xiàng)目免費(fèi),并且沒有設(shè)置申請數(shù)量的限制,但是由于致力于一同打造品質(zhì)、可靠性和性能俱佳的高性能嵌入式解決方案,所以英偉達(dá)在合作伙伴的遴選上會比較謹(jǐn)慎。