【深度】iPhone7大揭秘:“人工智能大腦”竟藏在蘋果iPhone里

時間:2016-09-08

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導語:本文全文編譯自Backchannel編輯StevenLevy的相關(guān)文章《TheiBrainisHere:andit’salreadyinsideyourphone》,在最大程度保留文章原貌的基礎(chǔ)上進行了極少數(shù)刪減。本文也是蘋果科技“軟實力”的一次大匯總,非常有閱讀的價值。

本文全文編譯自Backchannel編輯StevenLevy的相關(guān)文章《TheiBrainisHere:andit’salreadyinsideyourphone》,在最大程度保留文章原貌的基礎(chǔ)上進行了極少數(shù)刪減。本文也是蘋果科技“軟實力”的一次大匯總,非常有閱讀的價值。

獨家內(nèi)部視角看人工智能和機器學習如何改變蘋果

2014年7月30日,Siri做了一次“腦部移植手術(shù)”。

三年前的那個日子,蘋果成為第一家將智能助手移植到自己系統(tǒng)的主流科技企業(yè)。在更早的日子里,Siri這款在2010年通過收購納入囊中的產(chǎn)品一直以獨立應用程序的形式存在。

剛推出之時,大家對Siri都欣喜若狂,但隨著時間流逝,用戶卻愈發(fā)對其缺點變得不耐煩,因為它經(jīng)常性地誤解命令,產(chǎn)品微調(diào)之后也不見提升。

于是,蘋果在那個7月30日做了一個重要決定:把美國用戶的Siri語音識別遷移到以“神經(jīng)網(wǎng)絡(luò)”為基礎(chǔ)的新系統(tǒng)中,隨后在8月15日推廣到全世界用戶。

在新系統(tǒng)中,“隱性馬爾可夫模型”等一系列“老”技術(shù)仍在使用,但是更重要的是引入機器學習技術(shù),包括“深度神經(jīng)網(wǎng)絡(luò)(DNN)”、“卷積神經(jīng)網(wǎng)絡(luò)”、“長短期記憶單元”、“門控性電源(gatedrecurrentunits)”、以及“n-grams”。

經(jīng)過這次升級,Siri雖然看起來仍然一樣,但是卻得到了深度學習的強力buff。

為了不讓自己的競爭對手從Siri上獲得啟發(fā),蘋果再次采取了高度保密的策略。而用戶最多也只能體會到Siri犯的錯越來越少了。直到最近的揭秘,蘋果才公開談?wù)撈甬敃r的效果——準確率的提升幅度是驚人的。

蘋果高級互聯(lián)網(wǎng)軟件及服務(wù)副總裁EddyCue

EddyCue表示:“這次提升非常明顯,以至于有人專門核對了一次準確率的數(shù)字,以免不小心漏掉了小數(shù)點。(提升了至少一位數(shù))”

Siri這次的“華麗變身”,也讓人工智能業(yè)界“驚訝”,但不是因為他們的成績,更多的是因為蘋果如此低調(diào),但又能如此出色的完成這個任務(wù)。

即便蘋果最近在人工智能領(lǐng)域加大了人才的招聘力度,也做了一些高調(diào)的創(chuàng)業(yè)公司收購,大多數(shù)人還是將蘋果視為這個火熱領(lǐng)域的落后者。同時又因為蘋果的高度保密,讓人工智能相應的專家也不清楚他們在機器學習相關(guān)進展。正如斯坦福人工智能歷史課程講師JerryKaplan所說:

蘋果并沒有在人工智能社區(qū)中出現(xiàn),有點像人工智能領(lǐng)域的NSA(美國國家安全局)。

相比之下,其他硅谷獨角獸Google和Facebook在人工智能領(lǐng)域的努力,則更容易為外界所捕獲,并且傳播開來。

當然也有人會持有反對意見,來自AllenAI研究所的OrenEtzioni算一個:

Google、Facebook、微軟里都有頂尖的機器學習人才。而蘋果的確也聘用了一些人工智能方面的人才,但是公認的機器學習5位領(lǐng)袖都不在內(nèi)。

而且即便蘋果已經(jīng)用人工智能實現(xiàn)了語音的識別能力,但是接下來蘋果會將機器學習加入到什么功能之中?這仍然是個謎。

不過這個也不怪OrenEtzioni,這個月早些時候,蘋果秘密地展示了他們產(chǎn)品應用機器學習技術(shù)的進展,可惜對象不是他,而是我。

在好幾位蘋果高管(包括上文提到的EddyCue、高級全球市場副總裁PhilSchiller、高級軟件工程副總裁CraigFederighi,后兩者一直也被視為蘋果人工智能方面的關(guān)鍵性科學家)的陪同下,我在蘋果庫比提諾的飛船總部里面花了幾乎一整天,完整地了解機器學習在蘋果應用中目前以及未來的應用情況。

當我們坐下之后,他們就遞給我了一份兩頁而且“滿滿當當”的日程列表,上面全是機器學習在蘋果產(chǎn)品和服務(wù)中的應用,除了已經(jīng)實現(xiàn)、甚至還包括了他們即將討論的項目。

從這份列表中,你還能比較容易地提取出一個核心信息:

蘋果已經(jīng)進入了人工智能領(lǐng)域,而且絕不甘心成為“第二”這樣的角色,還將會采用一條不同于別人的路徑。

擁有iPhone的人看起來都是蘋果人工智能技術(shù)的直接受益者,但實際上不僅僅是因為Siri能夠很準確的理解你在問它什么。哪怕有人最近只是郵件了你,他都會出現(xiàn)在“最近聯(lián)系人”之列;側(cè)滑之后出現(xiàn)的“你接下來最可能打開的應用”列表;提醒你在“提醒事項”中標記了、但又沒有放進日程表的約會;在你輸入全名之前將你已經(jīng)預定了的酒店地點推送出來;甚至是在你沒有詢問的情況下直接把停車地點指示給你。

以上這些例子都跟深度學習和神經(jīng)網(wǎng)絡(luò)有關(guān)系,有些是因此變得可能,其他至少也得到了大幅度的增強。

沒錯,一顆真正的“蘋果大腦”——就藏在你的手機里。

臉部識別?蘋果借助其神經(jīng)網(wǎng)絡(luò)技術(shù),加入了混戰(zhàn)

根據(jù)我拿到的簡介來看,機器學習已經(jīng)滲透到蘋果產(chǎn)品和服務(wù)的每個角落。比如蘋果使用深度學習來檢測AppStore騙保行為,延長所有設(shè)備的電池壽命,從成千上萬份beta版報告中發(fā)現(xiàn)最有價值的用戶反饋。

而機器學習則讓蘋果能夠選擇適合你的新聞;也能讓AppleWatch分辨出你究竟是在鍛煉還是在閑逛;它能變成出你圖片中的面孔和地點;在Wi-Fi信號比較弱的情況下是否要轉(zhuǎn)換到移動網(wǎng)絡(luò);它甚至能化身為一名優(yōu)秀“電影制作人”,輕輕點擊一下就能快速地把你的照片還有影像片段拼合到一起。

蘋果的競爭者也在做著類似的東西,但是可以確定的是,在保護隱私這件事蘋果絕對是把人工智能技術(shù)用到了“極致”(這里指的是差分隱私技術(shù),點擊查看愛范兒相關(guān)報道)。當然,他們也并沒有打造出像蘋果的產(chǎn)品。

而且人工智能對于蘋果來說不算“新東西”,早在1990年代,蘋果已經(jīng)開始使用機器學習技術(shù)開發(fā)筆記識別程序(Newton平板)。這個研究成果在目前的蘋果產(chǎn)品上依舊有用,這也是為什么蘋果能很好地識別你的“狂草”。這跟蘋果一直都設(shè)有專門的機器學習團隊也有關(guān)系。

早期的機器學習非常原始,深度學習更一直被視為一個夢想,與現(xiàn)在成為“潮流”的情況相差甚遠。但是蘋果被套上了“落后者”形象這件事直接導致了TimCook最近專門站出來發(fā)話,表示蘋果其實一直都在人工智能領(lǐng)域,只不過沒有專門去宣傳而已。連帶著讓一大批蘋果高層最近也開展了宣傳攻勢。

AppleWatch上面的減肥應用,也有機器學習技術(shù)的加成

在蘋果高級全球市場副總裁PhilSchiller看來:

人工智能最近5年為蘋果帶來的增長大家有目共睹,我們設(shè)備智能化的速度變得更快,特別是在蘋果自己設(shè)計的一系列芯片幫助下。我們的設(shè)備變得更智能、更快,而我們所做的每一件事情,實際上都是為了讓事物能夠更好的鏈接到一起。

而更強大的硬件也讓我們能夠運用越來越多的機器學習技巧,因為他們提供了非常多的東西給我們進行學習。

雖然蘋果已經(jīng)選擇了“擁抱”機器學習,但是他們并沒有放棄基礎(chǔ)原則。在這群庫比提諾的先鋒者們眼里,深度學習和機器學習只是不斷出現(xiàn)的新技術(shù)之流中最新的那幾個。

它們擁有改變事物的能力,但并不一定超過一些其他技術(shù)優(yōu)勢,比如觸屏、平板電腦、面向?qū)ο蟮木幊碳夹g(shù)等。在蘋果眼里,機器并非其他公司口中的“人機交互終極目標”。EddyCue對此就曾表示:

這并不會摧毀這么多年以來建立的人機交互方式。

除此之外,我們還談?wù)摰搅艘恍┐蠹曳浅jP(guān)心的話題:蘋果對于機器是否將取代人類沒有興趣;不確認蘋果是否會制造無人駕駛汽車;甚至是打造蘋果自己版本的Netflix;承諾蘋果不會打造終結(jié)人類的“天網(wǎng)”等等。

PhilSchiller還單獨做了一個小總結(jié):

我們將利用這些技術(shù),從而比之前更好地做我們想要做的東西,或者完成一些我們之前無法做到的事。最終以非常蘋果的方式打造我們的產(chǎn)品。

他們隨后還拓展解釋了一下上述觀點,內(nèi)容主要集中在兩個方面,一個是人工智能究竟從何種程度改變了蘋果目前的生態(tài)系統(tǒng)。

第二個是蘋果為什么出于用戶隱私保護的目的,干掉普通的信息收集引擎(要知道,大量的數(shù)據(jù)可以會極大的改善神經(jīng)網(wǎng)絡(luò)的能力),從而確保用戶的數(shù)據(jù)不會被其他人濫用。很明顯,蘋果已經(jīng)有了跨越這兩個“障礙”的方法。

那么這個“蘋果大腦”究竟有多大呢?怎樣才能驅(qū)動iPhone之上的機器學習能力呢?而蘋果官方透露出來的大小是200MB左右,這個大小會隨著用戶保存的個人信息的多少而改變。這其中包括了應用使用頻率、跟別人的交互、神經(jīng)網(wǎng)絡(luò)處理、語音識別模型、以及“自然語言模型”。

當然,它還包括了用神經(jīng)網(wǎng)絡(luò)加成的對象識別,臉部識別以及場景分辨。

因為所有新應用的大前提,都是用戶的偏好以及經(jīng)歷等隱私不被公開。

盡管蘋果沒有把他們在AI方面的努力攤開來講,但我設(shè)法弄明白了他們怎么在組織里分配機器學習的專業(yè)知識。公司可以共享這些機器學習方面的人才,提供給那些用機器學習來解決問題并且開發(fā)個人方面產(chǎn)品的產(chǎn)品團隊。CraigFederighi對此解釋到:

機器學習的最高境界就是不要有一個集中的組織。我們試著把它和需要用來交付正確用戶體驗的團隊拉近距離。

那么蘋果有多少人在做機器學習方面工作?Federighi在再三催促下給出的答案只是兩個字“很多”。(如果你以為他可能會給我那個數(shù)字,那就是你不了解蘋果了。)有意思的是,蘋果很多從事機器學習的員工在加入之前都沒有受過人工智能的教學。“我們雇傭的這些人在數(shù)學、統(tǒng)計數(shù)據(jù)、編程語言、密碼學這些基礎(chǔ)領(lǐng)域有特長?!盕ederighi接下來也解釋了這種現(xiàn)象的原因:這些其他方向的核心天才可以完美的轉(zhuǎn)換到機器學習領(lǐng)域,雖然我們當下還在繼續(xù)招聘機器學習的專業(yè)人才,但是我們一直在繼續(xù)尋找有核心能力和天賦的人。

我們并沒有設(shè)立一個單獨、中心化的組織,來充當蘋果機器學習“殿堂”。

左前方的蘋果高級軟件工程副總裁CraigFederighi正在聽Siri項目資深指導AlexAcero在蘋果總部談?wù)撜Z音識別軟件。盡管Federighi沒有說,但是我覺得這種說法的確存在:蘋果一直強調(diào)保密,而行業(yè)內(nèi)的其他公司卻鼓勵自己的工程師向外界分享研究成果,這種模式不利于蘋果保持競爭優(yōu)勢。Federighi對于蘋果和別的公司的做法還做了一個“分類”:

我們的做法也讓程序員間的自然選擇被強化——一種喜歡通過團隊合作,從而打造出一個偉大的產(chǎn)品;另外一種只是打算將自己的技術(shù)展示出來。

如果科學家在提升蘋果產(chǎn)品的過程中能夠發(fā)現(xiàn)突破,這自然很好?!暗覀儗嶋H上是抱著對最終目標的幻想在前行”Cue補充了一句。

蘋果人工智能領(lǐng)域里的人才很多都是通過收購的方式進來的。Cue給出了一個比較“夸張”的數(shù)據(jù):

我們最近收購了二三十家相對較小的公司,同時雇傭了這些員工。

Federighi還補充了一個非常重要的“收購思路”:當蘋果收購AI公司的時候,并不是說“嘿,這兒有很多機器學習的研究人員,我們來設(shè)立一個部門吧!我們要的是那些有天賦并且真正專注于提供卓越經(jīng)驗的人。

蘋果最近以2億美元的報價收購了西雅圖的Turi公司。這家公司開發(fā)了一個可以和GoogleTensorFlow一較高下的工具包,這次收購引發(fā)業(yè)界猜測——蘋果有可能會在系統(tǒng)內(nèi)部和開發(fā)者方面提供與Google相似的目的,在場的幾位高管均對這件事不予置評。Cue則表示:

無論從科技的視角還是個人觀點來看,Turi都有很多和蘋果相符的地方。也許一兩年后,我們就可以弄清楚到底發(fā)生了什么,就像當初Cue(蘋果在2013年收購的小型初創(chuàng)公司,非上文提到的EddyCue)在Siri上展示的預測能力。

無論人才從哪兒來的,蘋果的人工智能基礎(chǔ)已經(jīng)能夠讓之前那些產(chǎn)品和技術(shù)上的不可能,重新變?yōu)榭赡堋_M而改變了公司的發(fā)展藍圖。Schiller的話就算一個小小的透露:

在蘋果,每天都有很酷的點子。機器學習讓我們能夠解決之前“不可能”的問題,并且已經(jīng)規(guī)劃進了我們接下來打算做的事情當中。

其中一個例子就是在iPadPro上使用的蘋果觸控筆。為了讓蘋果把高科技觸控筆列入產(chǎn)品中,不得不解決掉人們在電子設(shè)備上寫字,手會不小心觸碰到屏幕,從而導致各種字符混亂的問題。

使用機器學習模型“手掌誤觸”,可以有效的提高屏幕傳感器區(qū)別擦碰、觸摸和筆尖的精確度。

“如果它不能穩(wěn)定的運行,那這就不是一張可供書寫的紙,觸控筆也沒啥用?!盕ederighi說道。

如果你喜歡蘋果觸控筆,那就感謝機器學習吧。

也許蘋果到現(xiàn)在為止,機器學習方面最好的進步方法,就是從它最重要的人工智能產(chǎn)品——Siri那里獲得的。

Siri起源于一個雄心勃勃的項目DARPA的智能助手,不久后,就有幾個科學家組建了一個公司,打算用這種技術(shù)來打造一個app。

在2010年SteveJobs親自說服了創(chuàng)始人把它賣給了蘋果。Siri直接被構(gòu)建進了操作系統(tǒng)中,并成為了2011年10月iPhone4S發(fā)布會的重頭戲。而現(xiàn)在,它完完全全可以應用在實際中。當用戶長按Home鍵或是簡單的說一句“Hey,Siri?!本涂梢允褂茫╥Phone有個特性,能讓其中一個收音器始終打開又不會費電)。Siri無論在它工作時還是沉默時都和AppleBrain是一個整體。就核心產(chǎn)品而言,Cue用了產(chǎn)品的四個組件來說明:語音識別(理解你在和它說話),自然語言理解能力(掌握并理解你所說的話),執(zhí)行(實現(xiàn)你的詢問和要求),回答(回應你)?!皺C器學習影響了這些極其重要的方面”。Cue說道。

Siri高級研發(fā)負責人TomGruber(上)、以及Siri語音大師AlexAcero(下)TomGruber在2011年其中一個創(chuàng)始人離開后加入了蘋果,提到在蘋果給Siri使用應用神經(jīng)網(wǎng)絡(luò)之前,其用戶群就提供了大量數(shù)據(jù),這對于鍛煉這個神經(jīng)網(wǎng)絡(luò)很重要。

Steve曾說過,你會一夜之間從一個不知名的app一躍擁有一億用戶,并且無需公測。用戶會告訴你他們是怎么和你的app對話,這就是第一次革命,接著,應用神經(jīng)網(wǎng)絡(luò)就來了。Siri從最初的應用神經(jīng)網(wǎng)絡(luò)到現(xiàn)在能夠應對用戶的各種要求,全靠語音識別團隊的高管AlexAcero等幾位AI專家。90年代早期,Acero就開始了在蘋果語音識別團隊的生涯,然后又去了微軟研究院。

“我喜歡那里的日子,我還發(fā)表了很多論文,”他說道“但是當Siri面世的時候,我覺得這就是一個把應用神經(jīng)網(wǎng)絡(luò)得以實現(xiàn)的好機會?。〔皇莾H僅讓一百個人知道,而是要讓一百萬個人用到?!睋Q句話來說,這就是蘋果一直需要的科學家,熱衷于研發(fā)產(chǎn)品而不是發(fā)表論文。

機器學習非常顯著的、從多個方面對Siri造成了沖擊

在Acero三年前加入蘋果那時,Siri的語音技術(shù)實際上還主要是來自第三方的協(xié)議授權(quán),這注定要做出改變。Federighi還注意到這實際上是蘋果不斷重復的模式:

當這個技術(shù)成為決定我們能否做出好產(chǎn)品的關(guān)鍵技術(shù),我們就會建立自己的內(nèi)嵌功能然后實現(xiàn)我們想要的效果。但如果想要讓它變得完美,我們必須自己擁有技術(shù)并且不斷創(chuàng)新,語音技術(shù)就是我們采納一個東西,并且最終實現(xiàn)落地的最好例子。

蘋果團隊第一步選擇了用神經(jīng)網(wǎng)絡(luò)代替Siri原有的底層,“我們有一個不停運轉(zhuǎn)的大型GPU集群,最終我們得到了大量的數(shù)據(jù)”Acero透露到。2014年7月的發(fā)布證明這些循環(huán)性學習并沒有白費。

“在絕大多數(shù)語言中,錯誤率都實現(xiàn)了減半,有些情況下效果還會更好。這主要是因為深度學習技術(shù)以及我們的優(yōu)化方式——不僅僅是算法本身,最重要是整個系統(tǒng)中內(nèi)容的傳遞?!?/p>

這種內(nèi)容的上傳通常意味著泄密。蘋果也不是第一家將DNN技術(shù)使用在語音識別上的公司,但是蘋果證明了它在控制整個傳輸系統(tǒng)這件事上,有著先天的優(yōu)勢。

這首先就是因為蘋果一直自己生產(chǎn)自己的硬件芯片,Acero甚至表示這讓他能夠直接和芯片設(shè)計團隊以及芯片固件工程師進行編程,讓神經(jīng)網(wǎng)絡(luò)的效能最大化。Siri團隊的需求甚至還影響了iPhone設(shè)計中的其他很多方面。

“當然,這不僅僅是芯片。設(shè)備上設(shè)置多少個麥克風、麥克風應該如何放置、如何調(diào)整硬件、處理音頻的底層軟件,這些組件都需要進行協(xié)調(diào)。對比一些只是開發(fā)軟件的公司,這個優(yōu)勢實在領(lǐng)先太多?!?/p>

另外一方面:當蘋果的神經(jīng)網(wǎng)絡(luò)能夠在一款產(chǎn)品中運行起來,它還能夠作為其他用途中的核心技術(shù)。最終結(jié)果是,機器學習讓Siri理解你,并且將輸入方式從鍵入變成了聽寫。

比如在你寫信息和郵件的時候,點擊麥克風按鈕、然后直接說,的確比跟軟鍵盤較勁容易得多。

另外一個Cue提到的SIri組成是自然語言理解。2014年11月起,Siri開始使用機器學習來理解用戶輸入的內(nèi)容,而更進一步基于深度學習的版本也在一年之后推出。

就像之前在語音識別上做的那樣,機器學習也提升了用戶的體驗,尤其是在更靈活地理解用戶命令。

Cue為此專門拿出了自己的iPhone現(xiàn)場演示了一個例子,在調(diào)用Siri之后,他分別發(fā)出了“用Square現(xiàn)金給Jane發(fā)20美元(SendJanetwentydollarswithSquareCash)”、“直接給我妻子發(fā)20美元(Shoottwentybuckstomywife)”,最終的得到的結(jié)果完全一樣。

蘋果最近還表示,如果沒有Siri帶來的這些而便利,它們不太可能迭代出現(xiàn)有這個在語音控制方面如此復雜的AppleTV。

盡管早期的Siri強迫你使用一個相對固定的方式說話,但是被深度學習加成之后的超級版本不僅能夠區(qū)分一堆電影和音樂中的特殊選項。甚至還能處理一些模糊的概念:“我想看TomHanks主演的驚悚片(如果Siri足夠聰明,它最終推薦的應該是《達芬奇密碼》)”,在深度學習技術(shù)誕生之前,想要實現(xiàn)這樣的效果就是做白日夢。

借助今年秋天即將發(fā)布的iOS10系統(tǒng),Siri的聲音成為了機器學習改良的最后一個部分。同樣的,這個改變也是用神經(jīng)網(wǎng)絡(luò)直接代替了之前的第三方授權(quán)技術(shù)。

本質(zhì)上來說,Siri的發(fā)聲還是依靠一個采集了很多聲音的大數(shù)據(jù)庫,通過把句子打散成詞匯,再將詞匯的語音像堆積木一樣拼在一起。而機器學習所扮演的角色,則是讓單詞之間更加流暢,從而讓Siri的聲音更加像真人。

Acero同樣也做了一個演示——分別讓Siri閱讀兩段一致的內(nèi)容,第一個有著我們非常熟悉的“機器感”,而另外一個則非常流暢。而他所說的原因也非常簡單:“深度學習”。

雖然看起來這是一個很小的不起眼的細節(jié),但Siri有一副更加自然的嗓音實際上能夠催生出大變化。Gruber說了下其中的差別:

音頻只要更加高質(zhì)量一點,用戶們就會更加信任它。同時更好的語音也會引入用戶,并且讓用戶對Siri的使用率更高。

當蘋果最終將Siri對開發(fā)者開放,人們使用Siri的意愿,以及機器學習所帶來的提升就變得更加重要了。對蘋果批評者的意見進行處理是一個非常長期的過程。

也有很多人指出,蘋果的第三方伙伴數(shù)量停留在了兩位數(shù),與亞馬遜類似的Alexa擁有的、由外部開發(fā)者提供的超過1000種“技巧”相比,數(shù)量相差甚遠。

蘋果的回復則指出這樣的對比并沒有意義,因為在亞馬遜產(chǎn)品上用戶必須使用特定的語言去使用功能。而諸如SquareCash、Uber這樣應用通過Siri來使用也更加自然。

與此同時,Siri的改變也給蘋果產(chǎn)品以及用戶帶來了一些改變:用戶得到的是新功能以及完成相同任務(wù)的更多方式;而Siri服務(wù)的請求次數(shù)也在不斷上漲。

對于不斷拓展機器學習的蘋果來說,最大的問題在于如何在成功的同時堅持其原有的隱私證詞。蘋果加密了用戶的信息,這樣沒有任何人、哪怕是蘋果自己的律師也不能查看用戶數(shù)據(jù)(記得之前吃癟的FBI嘛?)蘋果還專門表示:不會將收集的用戶數(shù)據(jù)用于廣告目的。

在用戶的角度這也許是值得尊敬的,但這對于吸引頂尖的人工智能人才沒有幫助。

所有機器學習的專家,都希望能夠擁有一大堆數(shù)據(jù)。但是因為隱私政策,蘋果一直不愿使用這些數(shù)據(jù)。這種做法是否合理仍需進一步討論,但這確實讓蘋果一直被人看做人工智能世界中的局外人。

這種有普遍代表性的觀點,換回來的卻是蘋果高層的激烈抗議。他們認為在不保存用戶存檔的前提下,為機器學習提供所有所需文件,甚至將用戶行為的實例保存下來訓練神經(jīng)網(wǎng)絡(luò)都是可能的。Federighi補充到:

這一塊一直存在錯誤的敘述和權(quán)衡,大家認為我們是保護用戶隱私的異類其實是一件好事,但是為了讓絕大多數(shù)用戶的利益,我們愿意給行業(yè)中的其他人指出一條發(fā)展之路。

我們已經(jīng)找到了獲取我們需要的數(shù)據(jù),同時又能保護用戶隱私的方法。

這里有兩個關(guān)鍵問題,第一個涉及個人信息在機器學習基礎(chǔ)系統(tǒng)中的處理,當用戶的詳細信息被神經(jīng)網(wǎng)絡(luò)所收集,那么最終我們能得到什么資料呢?

第二個問題涉及到為了訓練神經(jīng)網(wǎng)絡(luò)和識別規(guī)律之時的信息聚集分類,你怎樣在保證群體數(shù)據(jù)的同時剔除個人信息?蘋果其實有同時解決兩者的方法,Cue表示:

有的人認為我們不能用人工智能來做這些數(shù)據(jù)分析,因為我們并不擁有這些數(shù)據(jù),但是我們已經(jīng)找到了方法,在獲取信息的同時保持隱私屬性。這也是我們的底線。

首先是第一個問題——保護被神經(jīng)網(wǎng)絡(luò)識別的個人喜好和信息,解決方法在于用更加獨特的方法來控制軟硬件。簡單一點的解釋就是,最為私人的東西會停留在蘋果大腦之內(nèi),“我們將最敏感的信息保存在能夠執(zhí)行ML的本地”。

舉個例子來說,右滑之后出現(xiàn)的應用列表。在設(shè)計中,這個位置需要顯示你接下來最可能打開的幾個應用。這些預測基于一系列因素,很多都涉及到用戶行為本身,這對于其他用戶來說并沒有意義,蘋果的處理方法就是直接在手機本地處理需求。

最終功能的效果也非常明顯,預測用戶接下來用什么應用基本能夠達到90%的準確率。

蘋果在設(shè)備上保存的其他個人信息主要是——用戶使用iPhone輸入法鍵入的內(nèi)容。通過利用神經(jīng)網(wǎng)絡(luò)系統(tǒng)分析你的輸入,蘋果可以能夠發(fā)現(xiàn)關(guān)鍵性的時間和物品,比如航班信息,聯(lián)系方式,甚至是約會——但是信息本身只會停留在你自己的手機當中。

即便部分信息會存儲在蘋果的云中,也會通過特定處理,讓這些存儲的信息無法反向還原“蘋果公司不需要知道你的愛好,或者你什么時候打算去哪里玩”。

蘋果也在盡量減少保存的信息量,對此Federighi也提到了一個例子:如果你的一段對話中有一部分需要進行搜索,其他公司必須將整段對話上傳到云端進行分析,而蘋果設(shè)備能夠在數(shù)據(jù)不離開設(shè)備的條件下檢測出關(guān)鍵信息——這是因為手機會將這些信息與手機內(nèi)的“知識庫”進行匹配。

它很精簡,但是是一個綜合性知識庫,包括了成千上萬的定位和對象。我們之所以采用本地化的策略,是因為我們知道你在哪里。

Federighi還透露,這個知識庫其實與所有的蘋果應用都有相連,包括我們用的搜索欄、地圖、甚至是瀏覽器,可以幫助用戶實現(xiàn)自動糾錯。

它其實一直在iPhone后臺,保持著工作狀態(tài)。

接下來的問題就是機器學習的循環(huán)問題:究竟蘋果的隱私政策是否真的影響到了它的神經(jīng)網(wǎng)絡(luò)算法?因為通常來說,神經(jīng)網(wǎng)絡(luò)都需要大量的數(shù)據(jù)來高效訓練網(wǎng)絡(luò)的準確度,但是蘋果并沒有放開使用所有用戶的行為,那他們又怎么能夠了解用戶呢?

就像很多其他公司一樣,蘋果也是有利用一些公開的信息庫來訓練他們的神經(jīng)網(wǎng)絡(luò),但是有些時候的確需要更加及時、更加特定的信息,這些智能從用戶的數(shù)據(jù)中來。

而蘋果的做法是——從用戶那里拿數(shù)據(jù),但是又確保自己不知道這些數(shù)據(jù)對應的用戶是誰。之前的做法是,完全讓數(shù)據(jù)匿名,然后以完全獨立于AppleID的另外一套系統(tǒng)來標識他們。(另外一套系統(tǒng)和AppleID之間的關(guān)系只有蘋果知道)

進入iOS10時代之后,蘋果更采用了一種全新的技術(shù):差分隱私。能夠在向大眾收集數(shù)據(jù)的同時完全不去辨識區(qū)分個體。

這方面的應用例子就好像蘋果向你展示最近的時髦詞匯,但是他們并不在之前所提到的知識庫甚至是輸入法的詞典當中;還有突然因為越來越多詢問而“浮出表面”的鏈接;或者單個emoji表情的使用頻率增加。

完成這些事的傳統(tǒng)方式是把所有信息,比如你輸入的所有字詞,上傳到服務(wù)器短,然后由他們來發(fā)現(xiàn)其中有意思的東西。我們也有做端到端的加密,所以我們選擇不這樣做。

雖然差分隱私現(xiàn)在聽起來更像一個學術(shù)詞匯,但是蘋果正在嘗試將這項技術(shù)普及出去。我們正在將它從研究所內(nèi)轉(zhuǎn)移到數(shù)以十億記的用戶面前。

Federighi緊接著又補充了一些相關(guān)的細節(jié):

我們在很多年前就開始做這件事,并且已經(jīng)在大規(guī)模應用中獲得了有趣的成果。而且,你會為它的隱私程度感到意外。

他緊接著描述了一個系統(tǒng)其中包括了虛擬的隨機和加密機制,即便我專門寫過一本關(guān)于加密的書,也很難跟隨他的思維。但是總結(jié)一點來說,它實際上是把數(shù)學噪聲加到蘋果收集的用戶信息碎片當中去。

在他看來蘋果的貢獻也是非常顯著的,同時也非常罕見的成為了蘋果對外公開的技術(shù),因為蘋果授權(quán)相應的科學家將工作細節(jié)和研究成果公制于眾。

對于機器學習如何改變蘋果的產(chǎn)品,這一點我們是可以肯定的。但是機器學習將如何改變蘋果自身這并不明確。按照其中一種思維來說,機器學習似乎與蘋果本身的氣質(zhì)不符。蘋果一直都是一家能夠全方位控制用戶體驗的公司。所有東西都被預先設(shè)計好,并且以最謹慎的方式寫好代碼。

但是當工程師開始應用及其學習,他們實際上是在讓軟件自身不斷去發(fā)現(xiàn)解決方案。蘋果是否能夠適應當下的機器學習系統(tǒng)?機器學習的結(jié)果是否最終會影響實際產(chǎn)品的設(shè)計?這都還是變數(shù)。Federighi對此表示:

這件事在內(nèi)部其實也引起了很多爭議,我們之前其實進行過非常長遠的思考。之前我們都是根據(jù)自己的經(jīng)驗,從多個維度去控制人機交互的細節(jié),最終達到最佳的用戶體驗。

但如果你嘗試通過大量數(shù)據(jù)訓練機器,從而模擬出用戶的行為,結(jié)果蘋果設(shè)計師的經(jīng)驗就不再占據(jù)領(lǐng)導地位,一切都是數(shù)據(jù)說了算。

蘋果的典型用戶將在自己的日常使用中體會到深度學習帶來的改變

但是蘋果沒有因此而退縮,Schiller表示:

這些新技術(shù)的確在影響著我們設(shè)計產(chǎn)品的思路,最終有一天我們也會因為他們能夠讓我們打造出更好的產(chǎn)品而是用他們。

這也許就是蘋果最終的解決方案:蘋果接下來依舊不會對采用的人工智能技術(shù)過多標榜,而是一如既往的利用它們來提升產(chǎn)品質(zhì)量,你iPhone里面的那個“大腦”就是最好的例子。

典型的蘋果用戶,將在體驗深度學習過程中愈發(fā)熱愛蘋果產(chǎn)品。而最令人激動的是這一切是那么難以察覺,以至于當你回過頭看差別的時候不僅發(fā)出感嘆:“這一切是怎么發(fā)生的?”

至于天網(wǎng)嘛,也許還要等等。

更多資訊請關(guān)注3C制造頻道。

中傳動網(wǎng)版權(quán)與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.treenowplaneincome.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0