搜索新聞

讓視頻會議系統(tǒng)多一些人工智能!

讓機器學會尋聲辨人
來源:中計報 更新日期:2008-05-28 作者:pjtime資訊組
內容導航:  分頁瀏覽 | 全文瀏覽

讓機器學會尋聲辨人

  據谷田介紹,如何將新型視頻會議系統(tǒng)擬人化,以貼近人工智能需求,是雅馬哈PJP系列倡導的最新網絡會議技術理念。這些理念將通過瞬間呈現(xiàn)技術、聲音非增幅音響設計、內置適應型回聲消除器等一系列技術得以體現(xiàn)。

  假如甲地和乙地一起舉行遠程視頻會議,甲地人員如何清楚確定乙地哪位與會者正在發(fā)言(視頻追蹤)十分重要。在處理這一問題上,思科、北電—寶利通采取的措施霸氣十足:打造一個30萬美元以上的網真會議室,租用超寬帶寬傳輸聲音和圖像,用超大電視墻1∶1地還原場景和參會者;而蘇州科達等國內企業(yè)的做法相對經濟實惠:用甲地員工手中的遙控器去控制乙地會議室攝像頭的轉動和焦距調節(jié),尋找小顯示屏幕一次裝不下的參會者或給出特寫鏡頭?傮w來說,這兩種做法都使用的是“尋聲辨人”的方式,但用的是人眼搜索。

  雅馬哈給這一問題增加了一條技術解決路徑,那就是使攝像頭學會尋聲辨人。谷田向記者介紹道:“不要忽略人類都是‘尋聲望去’這一聽覺的天性,在視頻會議系統(tǒng)中,視頻顯示與聲音的處理技術其實是密不可分的。以PJP-300V這款攝像頭、麥克風、揚聲器一體機為例,它可以實現(xiàn)說話人瞬間顯示的功能。即使使用普通液晶屏幕,會議發(fā)言人的特寫和聲音也能瞬間呈現(xiàn)。”這項技術的實現(xiàn),依靠的是在PJP-300V上面配列16個麥克風陣列,可以自動判別說話人的位置;通過說話人的位置信息和3個攝像機的切換、聯(lián)動,使說話人可以瞬間在屏幕上顯示出來。這項技術不需要攝像頭的切換動作,保證了會議順暢進行。同時這項瞬間呈現(xiàn)技術,在桌面型VoIP電話中也可以應用,使音頻會議呈現(xiàn)立體感,實現(xiàn)與語話者座位的匹配。

 標簽:
廣告聯(lián)系:010-82755684 | 010-82755685 手機版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時代網 版權所有 關于投影時代 | 聯(lián)系我們 | 歡迎來稿 | 網站地圖
返回首頁 網友評論 返回頂部 建議反饋
快速評論
驗證碼: 看不清?點一下
發(fā)表評論