搜索新聞

Adobe推出VoCo 能如同文本一般編輯口語音頻

來源：投影時代　更新日期：2016-11-15 作者：pjtime資訊組

Adobe 公司創(chuàng)新產(chǎn)品用戶大會 Adobe MAX 2016 上，Adobe 公司的 Zeyu Jin（顯然是個天朝工程師）宣布了 VoCo，一款可以讓你如同文本一般編輯口語音頻的應用程序。

VoCo 是針對音頻編輯工作的，它可以自動識別出人聲語音里的每個單詞（目前應該還僅限英文），然后你就可以按照需求剪切和粘貼文本從而改變音頻詞匯的順序，而不必去直接編輯波形（請看上面的演示視頻，越到后面越精彩）。關鍵它還有個超贊的地方，它還可以作為一個創(chuàng)作工具，只要 VoCo 對一個人 20 分鐘的語音進行分析之后，它就可以直截按新的文本合成這個人聲音。就是說你只要被別人捕捉到了至少 20 分鐘的演講，然后這個軟件就可以生成你從來沒有說過的話，讓別人聽上去足以以假亂真，以為你真的說過這些話。

雖然還只是在會上演示，過渡的地方還有些不完美，還沒有成為正式的產(chǎn)品，但是我們可以想象它的前景，特別是對于配音等工作來說可以成為又一件神器了。甚至一個聲優(yōu)只要被識別出了自己的聲音，視頻編輯人員就可以直接輸入文本讓軟件來自己說話了。

Adobe推出VoCo 能如同文本一般編輯口語音頻

Project VoCo 可以說是秉承了 Adobe 公司的理念，可以看到 VoCo 的這種方式有點像 PS（Photoshop）一般可以將音頻像圖像一樣分割成單獨的元素，甚至可以用現(xiàn)有元素生成新的內(nèi)容來完成完整的作品。當然如果是單純的分割元素重新拼接可能容易實現(xiàn)，厲害就厲害在它能根據(jù)某人語音進行分析之后直截生成新的音頻，也就是直接合成出來。我們推測這就牽扯到很多內(nèi)容了，音頻分析（比如頻率，共振峰等），還有機器學習等等。

我們都知道 Yamaha 的 VOCALOID 技術，一提到初音之類的甚至應該是很多人都知道。可以想象一下，如果是 VoCo 這樣的技術應用到這個上面是不是可以直接快速開發(fā)新的虛擬歌手？甚至個人在家錄上一些歌聲供分析之后是不是就可以直接做個自己的定制虛擬歌手呢？

另一，日本人最近也開發(fā)了一個叫類似的產(chǎn)品，它可以實時將你的聲音模擬成另據(jù)特點的別人的聲音，有點類似柯南的實時變聲器，可以變成任何一個人的聲音。還有 Krotos Dehumaniser 可以將你的聲音輕松變成怪獸的聲音。這些產(chǎn)品放到一起可能會帶來配音行業(yè)空前的變革。原諒我的腦洞，我想著以后會有公司開發(fā)一個融合了這些技術的產(chǎn)品...

期待 VoCo 能夠早日變成成熟產(chǎn)品推向市場。

如今唱歌都可以虛擬歌手直接碼字了，是不是以后配音也可以直接碼字了...

返回專業(yè)音響頻道首頁

推薦

年度大屏視聽行業(yè)評選，花落誰家？