突出人性化 中新凱潤DX4000視頻會議系統(tǒng)

DX4000視頻會議產(chǎn)品關(guān)鍵技術(shù)之音、視頻編碼
來源:投影時代 更新日期:2009-06-30 作者:pjtime資訊組
內(nèi)容導(dǎo)航:  分頁瀏覽 | 全文瀏覽

關(guān)鍵技術(shù)

一、視頻編碼MPEG4、H263和H264

    1. MPEG4與MPEG1、MPEG2的比較

MPEG 系列標(biāo)準(zhǔn)的基本參數(shù)

標(biāo)準(zhǔn)

幅面

幀率

帶寬

應(yīng)用領(lǐng)域

MPEG-1

352x24 或 320x240

24-30 fps

1.5 Mbps

Video CD, CD-ROM

MPEG-2

720x24 或 640x480

24-30 fps

4-8 Mbps

DTV,HDTV,DVD-Video

MPEG-4

34x48 ~ 4096x4096

1-30+fps

10Kbps~10Mbps

互聯(lián)網(wǎng)及無線傳輸,交互式電視

    從上表可以看出,MPEG1和MPEG2主要應(yīng)用于固定媒體,比如 VCD 和 DVD ,而對于網(wǎng)絡(luò)傳輸,MPEG4具有無可比擬的優(yōu)勢。

    2. H.263、H.264系列標(biāo)準(zhǔn)介紹

    H.263是國際電聯(lián)ITU-T的一個標(biāo)準(zhǔn)草案,是為低碼流通信而設(shè)計的。但實際上這個標(biāo)準(zhǔn)可用在很寬的碼流范圍,而非只用于低碼流應(yīng)用,它在許多應(yīng)用中可以認(rèn)為被用于取代H.261。H.263的編碼算法與H.261一樣,但做了一些改善和改變,以提高性能和糾錯能力。H.263標(biāo)準(zhǔn)在低碼率下能夠提供比H.261更好的圖像效果,兩者的區(qū)別有:(1)H.263的運動補償使用半象素精度,而H.261則用全象素精度和循環(huán)濾波;(2)數(shù)據(jù)流層次結(jié)構(gòu)的某些部分在H.263中是可選的,使得編解碼可以配置成更低的數(shù)據(jù)率或更好的糾錯能力;(3)H.263 包含四個可協(xié)商的選項以改善性能;(4)H.263采用無限制的運動向量以及基于語法的算術(shù)編碼;(5)采用事先預(yù)測和與MPEG中的P-B幀一樣的幀預(yù)測方法;(6)H.263支持5種分辨率,即除了支持H.261中所支持的QCIF和CIF外,還支持SQCIF、4CIF和16CIF,SQCIF相當(dāng)于QCIF一半的分辨率,而4CIF和16CIF分別為CIF的4倍和16倍。H.263已經(jīng)基本上取代了H.261。

    H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的聯(lián)合視頻組(JVT:joint video team)開發(fā)的一個新的數(shù)字視頻編碼標(biāo)準(zhǔn),它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。

    H.264和以前的標(biāo)準(zhǔn)一樣,也是DPCM加變換編碼的混合編碼模式。但它采用“回歸基本”的簡潔設(shè)計,不用眾多的選項,獲得比H.263++好得多的壓縮性能;加強了對各種信道的適應(yīng)能力,采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語法,有利于對誤碼和丟包的處理;應(yīng)用目標(biāo)范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求。

    在技術(shù)上,H.264標(biāo)準(zhǔn)中有多個閃光之處,如統(tǒng)一的VLC符號編碼,高精度、多模式的位移估計,基于4×4塊的整數(shù)變換、分層的編碼語法等。這些措施使得H.264算法具有很的高編碼效率,在相同的重建圖像質(zhì)量下,能夠比H.263節(jié)約50%左右的碼率。H.264的碼流結(jié)構(gòu)網(wǎng)絡(luò)適應(yīng)性強,增加了差錯恢復(fù)能力,能夠很好地適應(yīng)IP和無線網(wǎng)絡(luò)的應(yīng)用。

    3.為什么使用 H264標(biāo)準(zhǔn)用作視頻壓縮

    分層設(shè)計

    視頻編碼層具有高效的視頻內(nèi)容表示功能; 
    網(wǎng)絡(luò)提取層將網(wǎng)絡(luò)中所需要的數(shù)據(jù)進行打包和傳送;

    高精度、多模式運動設(shè)計

    支持1/4或1/8像素精度的運動矢量; 
    多模式的靈活和細致的劃分,大提高了運動估計的精確程度;

    幀內(nèi)預(yù)測功能

    在空間域進行預(yù)測編碼算法,以便取得更有效的壓縮: 

    4×4塊的整數(shù)變換

    由于用二變換塊的尺寸縮小,運動物體的劃分更精確,這樣,不但變換計算量比較小,而且在運動物體邊緣處的銜接誤疾差也大為減。

    為了提高碼率控制的能力,量化步長的變化的幅度控制在125%左右,而不是以不變的增幅變化。為了強調(diào)彩色的逼真性,對色度系數(shù)采用了較小量化步長;

    統(tǒng)一的VLC

    為快速再同步而經(jīng)過優(yōu)化的,可以有效防止誤碼。

    4.視頻壓縮算法的發(fā)展方向

    隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,MPEG4的應(yīng)用也越來越普遍,H264已經(jīng)無可爭議地成為了視頻產(chǎn)品壓縮算法的發(fā)展方向。

二、音頻編碼G.723.1

    1.國際電信聯(lián)盟G系列典型語音壓縮標(biāo)準(zhǔn)的參數(shù)比較

算法

類型

碼率(kbit/s)

算法延時(ms)

G.711

A-Law / μ -Law

64

0

G.722

SB-ADPCM

64/56/48

0

G.723.1

MP-MLQ/ACELP

6.3/5.3

37.5

G.726

ADPCM

16/24/32/40

0

G.727

Embedded ADPCM

16/24/32/40

0

G.728

LD-CELP

16

< 2

G.729

CS-ACELP

8

15

    2. G.723.1 壓縮后的語音質(zhì)量

    在國際標(biāo)準(zhǔn)中,統(tǒng)一使用 MOS(Mean Opinion Score)方法評價語音壓縮后的質(zhì)量。在MOS方法中,電話語音質(zhì)量的標(biāo)準(zhǔn)定為4分。也就是說,如果一種算法將語音壓縮后,MOS 值能達到4分,即說明其語音質(zhì)量和電話質(zhì)量等同,用戶無法分辨出其中的區(qū)別。

    對于DX4000系統(tǒng),G.723.1壓縮后語音質(zhì)量的MOS評測值是3.98(Source: DSP Group Inc., http://www.dspg.com ),即非常接近電話質(zhì)量。

    3.為什么使用G.723.1標(biāo)準(zhǔn)用作音頻壓縮

    壓縮率高:G.723.1算法將語音壓縮到6.3Kbps,在同類壓縮算法中壓縮率是最高的。

    語音質(zhì)量好:G.723.1算法壓縮后的語音質(zhì)量MOS值為3.98分,對于一般沒有受過專門訓(xùn)練的耳朵,已經(jīng)無法區(qū)分出語音是否經(jīng)過壓縮。這樣的語音質(zhì)量完全可以滿足網(wǎng)絡(luò)視頻會議的需求。

 標(biāo)簽:
推薦視頻會議廠商
廣告聯(lián)系:010-82755684 | 010-82755685 手機版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時代網(wǎng) 版權(quán)所有 關(guān)于投影時代 | 聯(lián)系我們 | 歡迎來稿 | 網(wǎng)站地圖
返回首頁 網(wǎng)友評論 返回頂部 建議反饋
快速評論
驗證碼: 看不清?點一下
發(fā)表評論