一、視頻編碼MPEG4、H263和H264
1. MPEG4與MPEG1、MPEG2的比較
MPEG 系列標(biāo)準(zhǔn)的基本參數(shù) | ||||
標(biāo)準(zhǔn) |
幅面 |
幀率 |
帶寬 |
應(yīng)用領(lǐng)域 |
MPEG-1 |
352x24 或 320x240 |
24-30 fps |
1.5 Mbps |
Video CD, CD-ROM |
MPEG-2 |
720x24 或 640x480 |
24-30 fps |
4-8 Mbps |
DTV,HDTV,DVD-Video |
MPEG-4 |
34x48 ~ 4096x4096 |
1-30+fps |
10Kbps~10Mbps |
互聯(lián)網(wǎng)及無線傳輸,交互式電視 |
從上表可以看出,MPEG1和MPEG2主要應(yīng)用于固定媒體,比如 VCD 和 DVD ,而對于網(wǎng)絡(luò)傳輸,MPEG4具有無可比擬的優(yōu)勢。
2. H.263、H.264系列標(biāo)準(zhǔn)介紹
H.263是國際電聯(lián)ITU-T的一個標(biāo)準(zhǔn)草案,是為低碼流通信而設(shè)計的。但實際上這個標(biāo)準(zhǔn)可用在很寬的碼流范圍,而非只用于低碼流應(yīng)用,它在許多應(yīng)用中可以認為被用于取代H.261。H.263的編碼算法與H.261一樣,但做了一些改善和改變,以提高性能和糾錯能力。H.263標(biāo)準(zhǔn)在低碼率下能夠提供比H.261更好的圖像效果,兩者的區(qū)別有:(1)H.263的運動補償使用半象素精度,而H.261則用全象素精度和循環(huán)濾波;(2)數(shù)據(jù)流層次結(jié)構(gòu)的某些部分在H.263中是可選的,使得編解碼可以配置成更低的數(shù)據(jù)率或更好的糾錯能力;(3)H.263 包含四個可協(xié)商的選項以改善性能;(4)H.263采用無限制的運動向量以及基于語法的算術(shù)編碼;(5)采用事先預(yù)測和與MPEG中的P-B幀一樣的幀預(yù)測方法;(6)H.263支持5種分辨率,即除了支持H.261中所支持的QCIF和CIF外,還支持SQCIF、4CIF和16CIF,SQCIF相當(dāng)于QCIF一半的分辨率,而4CIF和16CIF分別為CIF的4倍和16倍。H.263已經(jīng)基本上取代了H.261。
H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的聯(lián)合視頻組(JVT:joint video team)開發(fā)的一個新的數(shù)字視頻編碼標(biāo)準(zhǔn),它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。
H.264和以前的標(biāo)準(zhǔn)一樣,也是DPCM加變換編碼的混合編碼模式。但它采用“回歸基本”的簡潔設(shè)計,不用眾多的選項,獲得比H.263++好得多的壓縮性能;加強了對各種信道的適應(yīng)能力,采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語法,有利于對誤碼和丟包的處理;應(yīng)用目標(biāo)范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求。
在技術(shù)上,H.264標(biāo)準(zhǔn)中有多個閃光之處,如統(tǒng)一的VLC符號編碼,高精度、多模式的位移估計,基于4×4塊的整數(shù)變換、分層的編碼語法等。這些措施使得H.264算法具有很的高編碼效率,在相同的重建圖像質(zhì)量下,能夠比H.263節(jié)約50%左右的碼率。H.264的碼流結(jié)構(gòu)網(wǎng)絡(luò)適應(yīng)性強,增加了差錯恢復(fù)能力,能夠很好地適應(yīng)IP和無線網(wǎng)絡(luò)的應(yīng)用。
3.為什么使用 H264標(biāo)準(zhǔn)用作視頻壓縮
分層設(shè)計
視頻編碼層具有高效的視頻內(nèi)容表示功能;
網(wǎng)絡(luò)提取層將網(wǎng)絡(luò)中所需要的數(shù)據(jù)進行打包和傳送;
高精度、多模式運動設(shè)計
支持1/4或1/8像素精度的運動矢量;
多模式的靈活和細致的劃分,大提高了運動估計的精確程度;
幀內(nèi)預(yù)測功能
在空間域進行預(yù)測編碼算法,以便取得更有效的壓縮:
4×4塊的整數(shù)變換
由于用二變換塊的尺寸縮小,運動物體的劃分更精確,這樣,不但變換計算量比較小,而且在運動物體邊緣處的銜接誤疾差也大為減。
為了提高碼率控制的能力,量化步長的變化的幅度控制在125%左右,而不是以不變的增幅變化。為了強調(diào)彩色的逼真性,對色度系數(shù)采用了較小量化步長;
統(tǒng)一的VLC
為快速再同步而經(jīng)過優(yōu)化的,可以有效防止誤碼。
4.視頻壓縮算法的發(fā)展方向
隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,MPEG4的應(yīng)用也越來越普遍,H264已經(jīng)無可爭議地成為了視頻產(chǎn)品壓縮算法的發(fā)展方向。
二、音頻編碼G.723.1
1.國際電信聯(lián)盟G系列典型語音壓縮標(biāo)準(zhǔn)的參數(shù)比較
算法 |
類型 |
碼率(kbit/s) |
算法延時(ms) |
G.711 |
A-Law / μ -Law |
64 |
0 |
G.722 |
SB-ADPCM |
64/56/48 |
0 |
G.723.1 |
MP-MLQ/ACELP |
6.3/5.3 |
37.5 |
G.726 |
ADPCM |
16/24/32/40 |
0 |
G.727 |
Embedded ADPCM |
16/24/32/40 |
0 |
G.728 |
LD-CELP |
16 |
< 2 |
G.729 |
CS-ACELP |
8 |
15 |
2. G.723.1 壓縮后的語音質(zhì)量
在國際標(biāo)準(zhǔn)中,統(tǒng)一使用 MOS(Mean Opinion Score)方法評價語音壓縮后的質(zhì)量。在MOS方法中,電話語音質(zhì)量的標(biāo)準(zhǔn)定為4分。也就是說,如果一種算法將語音壓縮后,MOS 值能達到4分,即說明其語音質(zhì)量和電話質(zhì)量等同,用戶無法分辨出其中的區(qū)別。
對于DX4000系統(tǒng),G.723.1壓縮后語音質(zhì)量的MOS評測值是3.98(Source: DSP Group Inc., http://www.dspg.com ),即非常接近電話質(zhì)量。
3.為什么使用G.723.1標(biāo)準(zhǔn)用作音頻壓縮
壓縮率高:G.723.1算法將語音壓縮到6.3Kbps,在同類壓縮算法中壓縮率是最高的。
語音質(zhì)量好:G.723.1算法壓縮后的語音質(zhì)量MOS值為3.98分,對于一般沒有受過專門訓(xùn)練的耳朵,已經(jīng)無法區(qū)分出語音是否經(jīng)過壓縮。這樣的語音質(zhì)量完全可以滿足網(wǎng)絡(luò)視頻會議的需求。