語音開創(chuàng)人機交互新未來,人工智能開啟全新世界

時間:2017-01-22

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:回顧人機交互的發(fā)展歷程,實際上是工程師對機器不斷改造,以解放人的過程。

想象這樣的情景:你躺在床上,忽然想關(guān)掉頭頂刺眼得令你無法直視的智能燈泡。于是你開始四處翻找手機、解鎖、打開控制APP、尋找這盞燈的選項、點擊按鈕——好了,總算關(guān)掉了。發(fā)現(xiàn)了沒?原本可能5秒走過去按個開關(guān)的事,硬生生的花去了你將近1分鐘的時間。

上面的情景,并不是個例。從目前智能硬件的發(fā)展狀況來看,大部分智能設(shè)備仍只是“偽智能”設(shè)備,僅通過Wi-Fi通信模塊提供了基礎(chǔ)的聯(lián)網(wǎng)控制。在家庭設(shè)備的互聯(lián)領(lǐng)域,目前的重點都仍在設(shè)備及硬件連接上——然而,真正的智能化設(shè)備不僅僅是實現(xiàn)通信連接,更要在人與設(shè)備間的交互上不斷進化。

語音=人機交互的未來?

回顧人機交互的發(fā)展歷程,實際上是工程師對機器不斷改造,以解放人的過程。最早期,鍵盤是唯一的輸入設(shè)備,與你為伴的只有枯燥的指令與冰冷的字符界面;后來有了圖形界面,才有了鼠標。但是鼠標和鍵盤都只是交互的介質(zhì),并不符合直覺。真正好的交互,應(yīng)該符合人的直覺,上手即可用。

裝備了觸摸屏的智能手機,讓我們離這個目標更近了一步。靈敏的指尖,代替了鍵盤/鼠標這層中間介質(zhì),做到了所觸即所得,身體得以進一步解放。然而,雖然在空間上,你的身體不再需要端坐在電腦前——但操控一部手機,仍然需要手指和眼睛的全程參與——人機交互理應(yīng)有更好的未來。

語音交互,則為人機交互打開了新世界的大門。首先,感官占用更少了,手可以解放出來;其次,開口說話是我們先天具備的溝通技能,學(xué)習(xí)成本最小;最重要的是,聲波天然可以擺脫設(shè)備位置的束縛自由傳播,未來甚至可以做到device-free,在任何地方發(fā)出指令,都可以進行交互。在信息輸入的速度上,語音直接說出指令也比觸控點選來的方便。

想象一下,你再也不用翻箱倒柜的找手機,然后從一排排密密麻麻的APP中翻找目標——你只需自然的說出來:“臥室的燈關(guān)了吧,太晃眼了”,它就會乖乖的熄滅掉,甚至下次再打開時,你會發(fā)現(xiàn)亮度變低不那么晃眼了。

人工智能幫助提升人機交互體驗

要保證上面這種級別的語音交互,機器需要準確提煉出的重要訊息有“臥室、燈、關(guān)、晃眼”,并最終組合為2個單獨的指令“臥室燈→關(guān)閉”“臥室燈→初始亮度75%這需要設(shè)備具備自然語言理解的能力(NaturalLanguageUnderstanding,NLU),以正確地理解用戶的語音指令。而談到NLU技術(shù),人工智能是無法避開的一個話題。

擊敗國際頂級棋手李世石的“AlphaGO”,可能最為人熟知的人工智能了。幫助它在圍棋上擊敗對手的技術(shù),和幫助機器理解人類語言的NLU,是基于同一種的、起源于上世紀50年代的技術(shù)——機器學(xué)習(xí)。作為人工智能的核心技術(shù)之一,機器學(xué)習(xí)的核心在于“學(xué)習(xí)”二字上。通過模擬人類的學(xué)習(xí)過程,機器學(xué)習(xí)用一些特定的算法指導(dǎo)計算機利用已知數(shù)據(jù)得出適當?shù)哪P?,并利用此模型對新的情境給出判斷。這其中的關(guān)鍵,在于一種叫做“神經(jīng)網(wǎng)絡(luò)”的算法,它通過模仿人類神經(jīng)元工作方式,讓單一神經(jīng)元處理接收到的信號,并基于信號特性,給出相應(yīng)的反饋信息傳遞給關(guān)聯(lián)的其他神經(jīng)元,最終經(jīng)過多層神經(jīng)元的彼此篩選,得出針對信號的結(jié)論。

聽起很復(fù)雜的過程,實際上因為模擬了人腦處理信號的方式,可以通過有限次數(shù)的訓(xùn)練,讓程序自己學(xué)會對新信號的處理能力,即NLU(自然語言理解)。在神經(jīng)網(wǎng)絡(luò)算法,只要有足夠數(shù)量的語音數(shù)據(jù)來訓(xùn)練,機器也可以準確的理解人類語言的意圖,甚至是“言外之意”——問完天氣的你隨口抱怨一句“最近外面好冷”,它或許會調(diào)皮的提醒你,要不要規(guī)劃一趟飛往熱帶的海島之旅。

取代“偽智能”,語音交互讓設(shè)備服務(wù)鏈接更緊密

NLU技術(shù)在美國市場的應(yīng)用最為成熟,各巨頭也紛紛推出其基于語音交互的智能設(shè)備,希望提前搶占市場。而這一市場,目前有著界限鮮明的兩派:一邊是以Apple、Microsoft為代表的語音輔助派,把自家的手機版助手直接移植到了AppleTV、XBOX設(shè)備上,語音僅作為輔助交互手段。而另一邊是則更為激進的Google和Amazon,其推出的智能設(shè)備GoogleHome、AmazonEcho僅支持語音交互。技術(shù)方案各有不同,但四家巨頭在商業(yè)上的戰(zhàn)略野心驚人的相似:通過融入家庭生活,而成為家庭成員獲取服務(wù)的新入口。

如果把目光轉(zhuǎn)回國內(nèi),國內(nèi)有此野心的廠商目前并不在少數(shù),但市場反響平平。究其原因,智能音箱只是連接服務(wù)的一個可以實現(xiàn)語音交互的端口,最重要的是通過不斷疊加不同的服務(wù),并提升使用體驗,實現(xiàn)真正意義的智慧服務(wù)系統(tǒng)——設(shè)備+云服務(wù),這才是智慧家庭產(chǎn)業(yè)的重要發(fā)展方向。

在2015年底的第二次世界互聯(lián)網(wǎng)大會上,聯(lián)想集團總裁楊元慶曾提出:“未來的用戶需要的是設(shè)備+云服務(wù)的完美結(jié)合體驗,為此我們就必須打造更加智能的連接”,并很快組建了SmartHome(聯(lián)想智慧家庭)部門。

有消息表明,聯(lián)想SmartHome的首個智能設(shè)備將于近期推出。其“設(shè)備+云服務(wù)”的概念將如何踐行?設(shè)備的人機交互會采用Apple還是Amazon模式?如何更好的讓NLU適應(yīng)中國人的習(xí)慣?一切答案,恐怕只能等產(chǎn)品浮出水面才能揭曉了,讓我們共同期待吧!

更多資訊請關(guān)注工業(yè)機器人頻道

中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.treenowplaneincome.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0