
由世鏈nft數(shù)藏小編分享(shiliannft.com),與支持語音的設(shè)備對話這種事情不知道大家是否有做過?或者,比起打字來查找在線信息更喜歡使用語音搜索?由亞馬遜Alexa、蘋果Siri和谷歌助手等行業(yè)巨頭引領(lǐng)的語音控制技術(shù)近年來迅速崛起。并且,這種技術(shù)很直觀,允許自然、真實的交互。本文要講述的是語音技術(shù)與元宇宙的關(guān)系。
語音技術(shù)也可以用來獲得直觀的元宇宙體驗
考慮到現(xiàn)在大部分的VR頭戴設(shè)備的運行;虛擬現(xiàn)實控制器需要與環(huán)境互動,移動和導航。這些控制器是類似操縱桿的設(shè)備,允許抓取和推動虛擬物體。然而,因為它是手持的,所以它們限制了可能的使用情況,例如在元宇宙的工作場所,需要使用到自己的雙手。
另一方面,語音命令允許用戶免提控制和導航虛擬世界。基于語音的命令也可以提高AR體驗的便利性——無論它們是通過智能手機還是智能眼鏡工作。
聲音和語音識別技術(shù)將塑造未來的元宇宙
在未來的語音指揮元宇宙中,語音識別和聲音識別將是關(guān)鍵技術(shù)。語音識別使用自然語音處理和機器學習技術(shù)進行人類語言識別。它基本上有助于準確理解說話者在說什么。常見用途包括自動翻譯、字幕和語音命令。例如,它可以用在元宇宙游戲中,這樣玩家可以在發(fā)出語音命令的同時用手控制游戲。
注意:語音識別的目的是識別說話者的身份。這項技術(shù)的重點并不是正在說的單詞,而是口音、方言和語速等表征一個人說話方式的特征。例如,它可以幫助的設(shè)備識別。這項技術(shù)主要用于為個人設(shè)備創(chuàng)建語音密碼。此外,還可以訓練像Siri或Alexa這樣的個人人工智能助理,只幫助特定的人。在元宇宙中,語音識別可以用來識別誰說了什么。
這兩項技術(shù)都可能是未來元宇宙的關(guān)鍵。例如,由Realwear開發(fā)的語音控制軟件解決方案WearHF。用戶可以將該軟件與該公司的工業(yè)級耳機集成,將其轉(zhuǎn)換為免提設(shè)備,并可以選擇打開/關(guān)閉識別說話者聲音的功能。
允許語音命令打開了提供流暢體驗的新應(yīng)用
以元宇宙購物為例,其訪客轉(zhuǎn)化率可高達70%,預計到2024年市場規(guī)模將達到8000億。除了點擊互動之外,AR和VR創(chuàng)作者還可以提供語音互動。由語音安全驗證,這將使元宇宙購物更加安全。消費者還可以免提在虛擬商店購物,享受更身臨其境的購物體驗。
為了創(chuàng)造更好的面部表情,將畫外音與3D元宇宙頭像相匹配
語音技術(shù)對元宇宙的其他用途也至關(guān)重要。可以用它來裝備使用更真實的面部表情的化身。全球領(lǐng)先的人工智能和元宇宙公司NVIDIA正在創(chuàng)建Omniverse Audio2Face。該應(yīng)用使用生成式人工智能技術(shù)將畫外音與3D動畫結(jié)合起來。該應(yīng)用程序可用于創(chuàng)建逼真的元宇宙頭像和實時數(shù)字助理。
結(jié)論
元宇宙為人們的日常生活和工作開辟了新的互動方式。語音識別是這項技術(shù)是不可或缺的一部分,并且在未來將發(fā)揮更加重要的作用。因此,繼續(xù)創(chuàng)新語音技術(shù)是有必要的,可以改善用戶體驗,無論是在真實世界、元宇宙還是混合現(xiàn)實中。