玩過微信的朋友肯定知道語音識(shí)別技術(shù)的魅力在哪,現(xiàn)在,就連智能電視也支持語音操作了。不同于智能手機(jī)的操作風(fēng)格,智能電視的語音技術(shù)隨著品牌的不同,其可操作性、識(shí)別度都有一定的差距。今天,投影時(shí)代網(wǎng)就將以國內(nèi)知名彩電品牌三星和長虹為例,和大家一起了解一下語音識(shí)別技術(shù)。感興趣的朋友不妨關(guān)注。
語音識(shí)別技術(shù),也被稱為自動(dòng)語音識(shí)別Automatic Speech Recognition,(ASR),其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。與說話人識(shí)別及說話人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。
語音技術(shù)帶來的改變
語音技術(shù)撬動(dòng)世界的那個(gè)引爆點(diǎn)究竟在哪里?語音電視似乎正在逼近這個(gè)答案。語音識(shí)別控制這種人機(jī)交流的演示,靠的是由科大訊飛公司今年新推出的語音對(duì)講軟件,它除了打電話、發(fā)信息以外,還具有信息查詢和導(dǎo)航等多項(xiàng)功能,這一技術(shù)已經(jīng)處于國際領(lǐng)先水平。而在這背后,得益于訊飛公司擁有一支屬于自己的研發(fā)團(tuán)隊(duì)。1999年,這支創(chuàng)新團(tuán)隊(duì)成立時(shí),研發(fā)技術(shù)并不占優(yōu)勢(shì),但是他們把突破口放在了具體應(yīng)用方面,以產(chǎn)業(yè)化來引領(lǐng)創(chuàng)新發(fā)展。
這種創(chuàng)新氛圍吸引了越來越多的語音高精尖人才加入,成就了科大訊飛既擁有國際領(lǐng)先的尖端技術(shù),又有走進(jìn)千家萬戶的各種語音技術(shù)應(yīng)用。如今,科大訊飛的語音技術(shù)和產(chǎn)品在國內(nèi)主流語音應(yīng)用市場(chǎng)占有率已超過80%。包括長虹、創(chuàng)維、三星等幾乎所有中外品牌發(fā)布的智能電視新品上均應(yīng)用了科大訊飛的語音技術(shù)。電視機(jī)在操作體驗(yàn)方面得以提升。
三星語音功能簡析
三星與2012年在美國上市的智能電視的高端機(jī)型上均采用了新的輸入方式來代替遙控器。電視機(jī)殼的上部中央內(nèi)置有攝像頭及麥克風(fēng),由此可支持通過手部動(dòng)作進(jìn)行的手勢(shì)輸入及語音輸入。三星將這種新功能稱為“Smart Interaction”。此時(shí),三星的高端智能電視開始支持語音識(shí)別技術(shù)了,也就是說,用戶說出語音指令,電視機(jī)就會(huì)按照指令進(jìn)行操作。
三星語音識(shí)別功能
國內(nèi)啟動(dòng)語音操作時(shí),只需要按住語音鍵,對(duì)著電視機(jī)說出自己想要了解的資源(保持電視在聯(lián)網(wǎng)狀態(tài)),電視系統(tǒng)就會(huì)馬上出現(xiàn)相應(yīng)的操作結(jié)果。而三星,在啟動(dòng)語音功能時(shí),需要人說出可作為觸發(fā)源的語言。用戶需要說出“Hi TV”后,三星智能電視屏幕下方就會(huì)顯示出麥克風(fēng)的圖標(biāo)及操作菜單。此時(shí)可直接說出想要觀看的頻道號(hào),或切換頻道,也能調(diào)節(jié)音量。還能在休眠狀態(tài)下以語音方式開啟電視。
長虹語音功能簡析
一、Ciri簡述
Ciri是科大訊飛集團(tuán)和長虹共同研發(fā)的一個(gè)作用于智能電視人機(jī)交互式體驗(yàn)的智能語音系統(tǒng)。在智能電視中以一個(gè)虛擬精靈的形式存在,消費(fèi)者購買智能電視之后將不止獲得一臺(tái)電視,還將獲得一個(gè)可愛而且實(shí)用的家庭成員。Ciri支持四川、湖南、廣東等地方的方言,可以實(shí)現(xiàn)查看天氣預(yù)報(bào)、查找新聞、點(diǎn)播電影、電視劇、綜藝節(jié)目、在線音樂、搜索資料等功能,通過云端服務(wù)器實(shí)現(xiàn)語義理解,提供擬人化交流。
二、技術(shù)支撐
Ciri語音交互系統(tǒng)由擁有國際領(lǐng)先語音交互技術(shù)的研發(fā)機(jī)構(gòu)研發(fā),采用目前領(lǐng)先的語音技術(shù)作為支撐,通過語音云、語音識(shí)別、語音合成三項(xiàng)主要技術(shù)再配以友好用戶體驗(yàn)與智能語音控制兩大技術(shù)達(dá)到與智能電視進(jìn)行人機(jī)交互的目的。
●語音云(VoiceCloudComputing)
語音技術(shù)和云計(jì)算技術(shù)相結(jié)合形成的語音搜索和語音轉(zhuǎn)寫技術(shù),是采用云計(jì)算的方式來執(zhí)行語音操作。在云計(jì)算技術(shù)背景下,語音的文字轉(zhuǎn)換、語義理解,辨別等操作完全在“云”(服務(wù)器)端執(zhí)行,在后臺(tái)配備有強(qiáng)大的服務(wù)器群進(jìn)行無間隙的“云”支持。
●語音識(shí)別(VoiceRecognition)
解決的問題是讓計(jì)算機(jī)能夠“聽懂”人類的語音,將語音轉(zhuǎn)化成文字,相當(dāng)于給智能電視安裝上“耳朵”,使其具備“能聽”的功能。
●語音合成(VoiceSynthesis)
又稱文語轉(zhuǎn)換技術(shù),解決的主要問題是如何將文字信息轉(zhuǎn)化為可聽的聲音信息,相當(dāng)于給智能電視安裝上“嘴巴”,使其具備“能說”的功能,也即讓機(jī)器像人一樣開口說話。
●智能語音交互場(chǎng)景及用戶友好體驗(yàn)(Voiceinteraction&Friendlyexperience)
通過多項(xiàng)用戶研究,結(jié)合每一個(gè)操作步驟與用戶使用場(chǎng)景進(jìn)行最人性化的交互設(shè)計(jì),使整個(gè)交互體驗(yàn)友好而充滿樂趣:
Ciri是虛擬化的卡通精靈形象;Ciri可以是你的朋友、你的家人、你的私人助手、你的.....;Ciri提供多種語音庫(用戶可以在智能電視平臺(tái)中選擇不同地方方言的語音庫進(jìn)行交流)供用戶根據(jù)各自喜好進(jìn)行選擇切換;Ciri與你對(duì)話的內(nèi)容采用語音合成技術(shù)模擬真人發(fā)音,使整個(gè)交互體驗(yàn)更加友好而且人性化。
長虹語音功能
中文智能語音操作系統(tǒng)-Ciri是由長虹-訊飛語音應(yīng)用技術(shù)聯(lián)合實(shí)驗(yàn)室開發(fā)完成,長虹作為世界品牌500強(qiáng),是集研發(fā)、設(shè)計(jì)、制造、銷售于一體的多元化、綜合型的跨國企業(yè)集團(tuán),是全球極具競爭力和影響力的消費(fèi)類電子產(chǎn)品與服務(wù)的領(lǐng)先廠商。多年來,長虹持續(xù)發(fā)力,成功實(shí)現(xiàn)了由傳統(tǒng)家電企業(yè)向3C融合的智能家電企業(yè)的轉(zhuǎn)型,也在一定范圍內(nèi)帶動(dòng)了行業(yè)的發(fā)展。
目前,語音功能已成為智能電視應(yīng)用功能中的標(biāo)配,它根據(jù)對(duì)用戶說出的語音進(jìn)行判斷識(shí)別,通過系統(tǒng)識(shí)別找出用戶所要的語音資源,在此基礎(chǔ)上為用戶推薦推送個(gè)性化服務(wù)。用戶更容易看到自己喜歡的內(nèi)容,節(jié)約時(shí)間成本。