為了更加徹底的了解CUDA視頻解碼時(shí)對整機(jī)功耗的影響,我們還特地對三種解碼方式時(shí)的系統(tǒng)功耗進(jìn)行了測試,以得出最省電的高清視頻解決方案。和之前我們測試功耗的方法一樣,本次仍然采用的是一款功耗測試儀,記錄整機(jī)功耗。
采用功耗表進(jìn)行測試
測試結(jié)果和我們預(yù)料的差不多,使用CPU軟件解碼時(shí)的功耗最大,而使用顯卡PureVIDEo視頻處理單元解碼的功耗最小,使用CUDA調(diào)用流處理器解碼雖然功耗也比較低,但是相對于PureVIDEo解碼來說,還是要高一些。
前面我們已經(jīng)看過了使用CUDA進(jìn)行高清視頻解碼的方方面面,但對于很多用戶來說,CUDA高清視頻解碼的性能會(huì)不會(huì)受到顯卡游戲性能的影響也很重要,筆者專門找來了幾款主流顯卡進(jìn)行測試。
這部分測試所采用的視頻為《購物狂的異想世界》,分辨率仍然為1080P,采用TS封裝格式。下面是當(dāng)今熱門顯卡的測試成績:
由于筆者手里沒有比9600GSO更低的顯卡,所以未能加入如9400GT、9500GT等的測試成績。從上面的柱狀圖可以看出,不管是高端的GTX275,還是主流級的9600GSO,在使用CUDA進(jìn)行視頻解碼時(shí),CPU占用率百分比都沒有什么區(qū)別,數(shù)字上的差異完全在誤差范圍之內(nèi),可以看出GPU游戲性能(流處理器數(shù)量)基本不會(huì)影響CUDA解碼H.264視頻的性能表現(xiàn)。
不過,根據(jù)國外一些媒體的測試,9400GT等這些采用16個(gè)流處理器的顯卡,在使用CUDA解碼H.264視頻的時(shí)候,CPU占用率會(huì)高一些。實(shí)際上,由于計(jì)算量并不龐大,CoreAVC在工作的時(shí)候也僅僅是利用了GPU中的一小部分流處理器資源,所以主流以上級別顯卡都沒什么差距。
看完前面長篇大論的介紹,相信各位對CUDA高清視頻解碼已經(jīng)有了一個(gè)比較深刻的認(rèn)識(shí)和了解。從本次的測試部分結(jié)果來看,使用CUDA進(jìn)行高清視頻解碼無疑是目前最好的折中方案,由于不受DXVA的限制,使用CUDA解碼在兼容性、畫質(zhì)方面要明顯好于傳統(tǒng)的GPU硬解碼——PureVIDEo HD,另一方面在效能和功耗方面領(lǐng)先CPU很多倍。
前面我們已經(jīng)介紹過使用CUDA進(jìn)行視頻解碼的優(yōu)勢,然而實(shí)際上,使用CUDA進(jìn)行高清解碼的好處還遠(yuǎn)不止這些。首先,我們再也不必頻繁的在解碼器設(shè)置中頻繁的改變設(shè)置來解決兼容性問題,使用CoreAVC幾乎可以完美解碼所有H.264視頻。就拿“完美解碼”這款軟件來舉例,我們只需要將H.264的解碼設(shè)置成CoreAVC并開啟CUDA加速、VC1的解碼開啟微軟WMV硬件加速、MPEG2視頻使用CyberLink DXVA硬件加速,就可以實(shí)現(xiàn)一勞永逸的解碼器設(shè)置方案,幾乎可以完美播放所有高清視頻。
完美解碼的解碼器一勞永逸設(shè)置方案
另一方面,CUDA解碼還有一大好處就是能獲得視頻數(shù)據(jù)流,從而在此基礎(chǔ)上進(jìn)行后處理或者轉(zhuǎn)碼運(yùn)算,比如 TotalMedia Theatre倍線,MotionDSP運(yùn)動(dòng)補(bǔ)償,Badaboom轉(zhuǎn)碼都直接采用了CUDA解碼以及CUDA編碼的方案,所以轉(zhuǎn)換效率非常高。而PureVIDEo解碼無法獲得視頻數(shù)據(jù)流,其輸出的數(shù)據(jù)只能輸出到屏幕上,沒有辦法再進(jìn)行后期處理。
第三,雖然目前中高端CPU軟解高清視頻已經(jīng)不費(fèi)吹灰之力了,但這是在正常速度下播放高清視頻時(shí)才能實(shí)現(xiàn)這么好的效果,但如果用高倍速播放高清視頻呢呢,CPU照樣不堪重負(fù)。比如,視頻轉(zhuǎn)碼的時(shí)候,其實(shí)就是高倍速處理視頻,此時(shí)即便四核也忙得不可開交,如果能將這部分運(yùn)算交給GPU CUDA處理,速度自然更快,效率更高,消除了轉(zhuǎn)碼瓶頸。
照這樣來看,如果第三方播放軟件能進(jìn)一步優(yōu)化的話,相信基于CUDA解碼器的倍線等一系列技術(shù)都能在終極解碼或完美解碼上實(shí)現(xiàn)。
如果要說CUDA解碼視頻的缺點(diǎn)的話,想必目前最大的缺點(diǎn)就是無法支持VC-1以及MPEG2編碼格式的視頻,這與CoreAVC解碼器本身只是針對H.264解碼的根本特性有關(guān)。不過筆者相信,在未來肯定會(huì)有解碼器廠商推出基于CUDA的VC-1視頻解碼器。另一方面,由于CUDA僅僅支持G8x之后的NVIDIA DX10顯卡架構(gòu),所以該解碼方法Geforce 6、Geforce 7以及A卡用戶均沒有辦法享受。
總體來看,使用CUDA進(jìn)行高清視頻解碼在原有的PureVIDEo HD解碼方式基礎(chǔ)上,給了用戶另一個(gè)非常好的選擇,而其能直接獲得視頻數(shù)據(jù)流的特性想必也會(huì)被更多廠商所利用。如果說GPU完全硬解高清視頻是視頻解碼的一次革命的話,那么使用CUDA進(jìn)行高清視頻解碼絕對可以算得上是又一次革命。