如今,人機交互技術應用潛力開始凸顯,比如智能手機配備空間跟蹤技術,應用于虛擬現(xiàn)實、遙控機器人及遠程醫(yī)療等的觸覺交互技術,對于有語言障礙的人士的無聲語音識別,還有各種創(chuàng)新技術,如指紋識別、TDDI、壓力觸控技術等,現(xiàn)在都比較熱門。
在車聯(lián)網領域的人機交互,特別是語音交互技術應用越來越明顯,智能后視鏡、HUD、車機、車載音箱以及中控系統(tǒng),都紛紛加入了語音交互系統(tǒng)。在車聯(lián)網以及車上的人機交互,其實是一個非常重要的業(yè)務方向,在這個方向上,思必馳一直專注在車聯(lián)網的一些人機交互以及第三方內容的服務平臺整合。那么在車載環(huán)境下語音技術的應用,到底應該關注些什么?對此,電子發(fā)燒友針對車聯(lián)網中的人機交互與后端服務采訪了思必馳副總裁雷雄國。
針對語音標配問題,思必馳副總裁雷雄國談到,手機的標配是觸控,智能手機的標配是觸控,從交互模式上來看,語音交互是從觸控到語言的交互,這個是一個方面;另一方面,未來很多的交互會依托與它的硬件形態(tài),也就是現(xiàn)在很多人說手機未來會多少年會消失,但是從真正科技發(fā)展的角度來看,包括現(xiàn)在物聯(lián)網整個的興起,很多新奇的硬件都會智能化,這時候各種各樣的手背其實并沒有屏幕的,而交互的核心目的是希望在這些硬件上面獲取一些信息、功能,通過硬件顯然是不能滿足,在這樣一個發(fā)展情勢下,語音一定會成為標配。
從交互的角度來看,在接下來的車載智能化的過程中,語音僅僅是占人機交互其中的一個環(huán)節(jié)。雷雄國指出,希望能看到更多的交互跟語音結合在一起,包括體感、手勢、圖象等等一系列的人工智能的技術能夠迅速進入到車內,并有多個在實際車載里面應用的多模態(tài)技術。
語音交互中難點該如何攻克
在談論車載語音怎么去用,交互怎么去做的時候,作為一家語音技術的廠商思必馳,更多關注的是語音到底能解決什么問題,以及在目前的應用過程中,語音技術還有那些難點需要去攻克?對此,雷雄國分享了三點。
第一,噪聲環(huán)境。噪音環(huán)境非常重要,需要得到非常好的解決,能夠在車載的環(huán)境下,把噪聲問題解決掉是人機交互第一步的基礎。在解決這個問題的時候,有一大類的方向是包括在出現(xiàn)錯誤的時候,允許糾正打斷;包括對一些車載噪聲以及環(huán)境噪聲的抑制自適應;包括在實際車的設備在播放一些音樂或者聲音的時候,能夠隨時的打斷它等等這些;
第二,智能交互。在交互的過程中,其實很多的交互只是提到了語音識別,這方面事實上用戶體驗非常不好,它其實更多的包括人工智能的核心技術引進,包括跟車內業(yè)務的整合,使得車內的人機語音交互能達到更高的用戶體驗,這里面就包括一些對于語音理解,以及人機多人的交互對話,基于任務式的深度的交互理解;
第三,更貼合用戶需求的產品設計。經過多年跟一線客戶的交流得出非常重要的一點,其實很多時候技術上可能達到了一定的階段,事實上需要上下游合作伙伴一塊來針對車聯(lián)網的產品進行多方位、多層次的結合跟設計,這里面需要產品方、技術方,甚至需要廠商一塊來配合。
交互核心在車里面交互比較重要的一塊,就是回音消除。雷雄國表示,產品設計是全方位的,可以從三個角度來看。
其一,對于在車內環(huán)境下面,其實很多車主在開車的過程中都會開啟背景音樂,在背景音樂開啟的情況下在做其它的操作,這時候其實是需要有這種背景音樂的情況下去打斷他,這時候事實上麥克風跟喇叭的一些結構的設計,產品在這一塊需要做些配合,這是其中一個;
其二,對于語音技術怎么樣跟業(yè)務結合,怎么樣跟導航結合,怎么樣把第三方的音樂資源對接得更加地緊密、無縫,這里面也需要投入大量的產品設計以及開發(fā)去做,把它的用戶體驗做到極致;
其三,就是在目前的車的環(huán)境我們能夠提供的相對更加聚焦,所以把導航、電臺、第三方路礦等等跟車主相關的第三方服務整合在一塊,這是非常重要的點。
圍繞著這些,思必馳在對語音識別的交互技術上做了一些上下游合作伙伴的整合,這個是在技術導航這一塊,跟百度、高德、海立德一系列的市面上主流的廠商都做了深度的整合。在實際很多的車載使用場景,其實都能交互,能夠讓用戶真正的實現(xiàn)全程語音交互,也就是他不需要在開車的過程中中間再去結合手觸屏的交互結束任務,這是非常重要的方面。
為車聯(lián)網打造了AIOS系統(tǒng)
談到操作系統(tǒng)上,雷雄國表示,思必馳在車聯(lián)網領域打造了一個AIOS,它是一個后操作系統(tǒng),實際上也不是一個操作系統(tǒng),只是把語音交互,包括內容服務等等這些整合在一塊,能夠迅速地讓第三方能夠把車聯(lián)網的整個語音交互給做起來的這么一個后操作系統(tǒng)。AIOS主要有四大特色。
1、內置智能語音交互:最先進的智能對話交互技術,彌補傳統(tǒng)操作系統(tǒng)在自然語音和語音交互上的缺失;
2、支持主流操作系統(tǒng):可定制型智能交互中間系統(tǒng),運行于主流操作系統(tǒng)上的侯操作系統(tǒng),支持Android、QNX、Linux等;
3、快速集成支持定制:支持快速集成和自定義開發(fā),只需要簡單的業(yè)務層接口集成即可封裝出貨;
4、集成豐富內容服務:除了強大的語音交互功能外,還能提供廣泛的第三方內容集成服務。
雷雄國補充道,思必馳目前除了AIOS之外,還有針對機器人以及智能家居的整套解決方案,AIOS里面有一系列的核心技術,AI這一塊,對于合作伙伴和用戶來說它并不是特別關注,對于語音技術絲毫不了解的開發(fā)者來說,并不影響他去使用整個語音交互的功能,OS這一塊,把這些功能做一系列模塊化的組建,在每一個客戶有一些定制需求的時候,能夠做到自己去做定制開發(fā),所以這給用戶和開發(fā)者留下非常差異化的實現(xiàn)方式。
另外,第三方服務包括地圖類的、影印類以及第三方的基于O2O的服務,目前思必馳都已經把這些服務接進來。雷雄國表示,目前希望在這些平臺上接入更多合作伙伴關于車的服務,除了智能車載,還有智能家居和機器人,在這兩個領域還有一些核心技術,其實包括原廠的識別,包括回音消除以及聲源定位等等相關技術,這些技術在整個的交互過程中會扮演著非常重要的角色。
從目前第三方合作內容的上面來看,思必馳也是一個非常開放的心態(tài)。雷雄國強調,思必馳希望能夠與跟更多的第三方內容服務方合作,把語音交互做得可以提供每一個內容服務,也可以從語音交互都能夠關注到內容服務,達到沒有雙手交互的情況下也能傳遞給車主用戶。
更多資訊,請關注人機界面頻道。