作為NVIDIA Ampere架構(gòu)的最新成員,NVIDIA RTX™ A4500采用的是GA102的核心架構(gòu),與NVIDIA RTX A5000采用的核心架構(gòu)相同。RTX A4500的核心數(shù)量和顯存容量都介于RTX A5000和 RTX A4000之間,所以性能也是介于兩者之間。相對(duì)于RTX A4000,RTX A4500支持NVIDIA®NVLink™技術(shù),和RTX A5000使用相同的NVLink橋接器,雙卡下可以增加顯存通訊交互的帶寬,從而提高GPU效率。
繼上次進(jìn)行了RTX A4500的開(kāi)箱之后,麗臺(tái)科技本次為大家?guī)?lái)最新的RTX A4500的實(shí)測(cè)分析,本次測(cè)試主要對(duì)比的是RTX A4500相對(duì)于RTX A4000的性能提升,一起來(lái)看看吧!
測(cè)試環(huán)境
測(cè)試工具說(shuō)明
顯卡規(guī)格對(duì)比
一、計(jì)算性能實(shí)測(cè)結(jié)果對(duì)比分析
LuxMark
LuxMark是基于OpenCL庫(kù)的渲染引擎,圖像的渲染速度和OpenCL的計(jì)算速度成正比。OpenCL是開(kāi)放運(yùn)算語(yǔ)言,目前顯卡的技術(shù)指標(biāo)中也都支持這種計(jì)算API和編程語(yǔ)言。
從LuxMark的OpenCL計(jì)算性能測(cè)試結(jié)果來(lái)看,RTX A4500得分是RTX A4000的1.36倍,在GPU計(jì)算性能方面提升幅度很大。
二、圖形性能實(shí)測(cè)結(jié)果對(duì)比分析
SPECviewperf 2020
SPECviewperf 2020主要是用來(lái)評(píng)測(cè)顯卡專業(yè)圖形性能的軟件,其中包括了我們常見(jiàn)的3ds Max、Maya、Catia、Siemens NX、SolidWorks、Creo軟件性能測(cè)試,以及醫(yī)療和能量仿真性能測(cè)試。通過(guò)模擬對(duì)軟件場(chǎng)景的交互操作的速度來(lái)評(píng)分,最終得出顯卡圖形方面的相對(duì)性能。
專業(yè)圖形性能方面,我們以RTX A4000的性能為1,來(lái)對(duì)比RTX A4500性能的相對(duì)提升。在3ds Max、Catia、Creo、Maya、SolidWorks項(xiàng)目測(cè)試中,RTX A4500性能是RTX A4000的1.1倍,在Energy、Medical的項(xiàng)目里RTX A4500是RTX A4000的1.2倍性能,Siemens NX的得分兩者幾乎持平。
三、實(shí)時(shí)渲染性能實(shí)測(cè)結(jié)果對(duì)比分析
Superposition Benchmark
Superposition測(cè)試的是GPU實(shí)時(shí)渲染的性能,攝像機(jī)在3D場(chǎng)景里漫游,顯卡實(shí)時(shí)渲染物品運(yùn)動(dòng)、光影和材質(zhì)然后輸出到顯示設(shè)備。
Unigine引擎的實(shí)時(shí)渲染中,使用DirectX和OpenGL圖形API,RTX A4500的性能分別是RTX A4000的1.17倍和1.19倍。
3DMark
在3DMark中,Time Spy Extreme 4K渲染RTX A4500是RTX A4000的1.2倍,Time Spy 1080P渲染,RTX A4500是RTX A4000的1.25倍。在使用光線追蹤渲染的場(chǎng)景Port Royal中,RTX A4500是RTX A4000的1.28倍。
四、離線渲染性能實(shí)測(cè)結(jié)果對(duì)比分析
離線渲染在媒體娛樂(lè)、設(shè)計(jì)制造以及建筑行業(yè)廣泛應(yīng)用,目前很多渲染器均支持GPU渲染,渲染的速度就取決于顯卡的計(jì)算速度。
Blender 4K Rendering
在Blender中渲染,使用Cycles渲染器渲染,Cycles同樣可以支持CUDA和Optix兩種方式進(jìn)行渲染。在CUDA的渲染性能上RTX A4500是RTX A4000的1.35倍。在Optix的渲染性能上RTX A4500是RTX A4000的1.28倍。但是相同的場(chǎng)景下,使用Optix渲染速度顯然要比CUDA快很多。
Octane Benchmark
OC渲染器的benchmark測(cè)試中,RTX A4500的性能是 RTX A4000的1.39倍,離線渲染速度有了大幅的提升。
Autodesk VRED 4K Rendering
使用VRED GPU加速渲染,渲染速度對(duì)比之下,RTX A4500提升速度不多,RTX A4500渲染速度僅是RTX A4000的1.09倍。
Keyshot 4K Rendering
Keyshot是工業(yè)級(jí)的渲染器,本次測(cè)試渲染的是4K分辨率的圖片。從實(shí)際測(cè)試結(jié)果看,RTX A4500的性能是RTX A4000的1.31倍。
五、編解碼實(shí)測(cè)結(jié)果對(duì)比分析
FFmpeg
在編解碼測(cè)試中,由于兩者都是安培架構(gòu)的顯卡,所使用的編解碼芯片是一樣的,編解碼器的數(shù)量也相同,所以在編解碼性能上差距不大。從總的測(cè)試情況來(lái)RTX A4500的性能略高于RTX A4000,提高不多。
六、訓(xùn)練和推理實(shí)測(cè)結(jié)果對(duì)比分析
DL ResNet50
ResNet50分別測(cè)試了使用FP16和FP32來(lái)處理圖片的速度,半精度下,RTX A4500的處理速度是RTX A4000的1.31倍。在單精度下RTX A4500是 RTX A4000的1.36倍,提升了30%以上的性能,性能提升幅度比較大。
Image-classification
在推理方面,在FP16下,RTX A4500的處理速度是RTX A4000的1.38倍,在INT8下,RTX A4500的處理速度是RTX A4000的1.32倍,都有30%以上的性能提升。
總結(jié)
NVIDIA RTX A4500在技術(shù)指標(biāo)和測(cè)試性能上都介于RTX A4000和RTX A5000之間,是NVIDIA專業(yè)圖形卡產(chǎn)品線有力的補(bǔ)充。
總的來(lái)說(shuō),RTX A4500的亮點(diǎn)表現(xiàn)在:
支持同步卡接入實(shí)現(xiàn)多屏同步
支持NVLink雙卡顯存交互,減少延遲
20GB的大顯存可以讓RTX A4500在各種3D場(chǎng)景實(shí)現(xiàn)流暢操作,GPU渲染的性能很高
在深度學(xué)習(xí)訓(xùn)練和推理性能上都有30%以上的提高,可以支持更多人工智能的應(yīng)用