華為終端手機智慧業(yè)務和技術開發(fā)

文:中國傳動網2018年第三期

 

  華為手機主打Mobiel AI戰(zhàn)略,在2017年發(fā)布業(yè)界第一個帶神經網絡手機,整個手機AI的策略和協(xié)同都是由整套體系架構來保證的。HiAI是面向移動終端的AI開放平臺,構建三層AI開放生態(tài):服務能力開放、應用能力開放和芯片能力開放。端、芯、云結合的三層開放平臺為用戶和開發(fā)者帶來更多的非凡體驗。本文整理自華為終端BG智慧工程系統(tǒng)部部長盧惠莉的演講稿。

    近兩年來,AI的發(fā)展火爆,從技術上來看,自1956年就有了神經網絡,中間經過兩次波峰、波谷。上世紀90年代,基于AI的機器學習快速發(fā)展,目前整個產業(yè)有將近3億的規(guī)模。整個AI規(guī)模發(fā)展上有三個重要的點,第一是算力突破。前兩次機器學習因為算力不足,有兩次大的波峰、波谷。大的神經網絡有100多層,GPU跑要一周,CPU跑要十幾年;在二十年前這樣模型系統(tǒng)的算力是支撐不了的。這幾年,算力的發(fā)展為整個智能領域的發(fā)展奠定了非常好的基礎。第二是算法理論的突破,第三是數(shù)據(jù)突破。移動和互聯(lián)網的發(fā)展使得數(shù)據(jù)規(guī)模指數(shù)呈倍數(shù)增長,而不只是翻倍。現(xiàn)在我們有上億用戶,每天有幾百萬、上千萬的交互數(shù)據(jù),這樣一個數(shù)據(jù)規(guī)模使得我們的神經網絡模型訓練和未來的技術突破有了非常好的基礎。

    AI在整個行業(yè)有非常大的發(fā)展機會,對于手機而言到底意味著什么?手機從功能機到智能機,對我們生活產生非常大的影響。這些影響體現(xiàn)在幾個方面。以前的功能機是用手機打電話、發(fā)短信。而智能機,可以用來上網、社交、聽音樂、拍照片、拍視頻、分享,重新定義了手機面向用戶的交互體驗。從原來被動地接受用戶打電話,變成更主動的服務,更自然地跟用戶交互和基于用戶個性化體驗的交互。

    現(xiàn)在蘋果語音助手Siri已經非常普及,華為的語音助手小易,也實現(xiàn)了基于AI的自然交互。在這樣的技術背景下,整個手機定位發(fā)生非常大的變化。手機主動與物理世界發(fā)生交換和互動,手機與人的關系從被動響應到雙向交互。手機從原來的工具變成人的助手,這個助手從原來被動的響應和接受人的交互,變成了它知道很多你所不知道的,因為它背后有強大的互聯(lián)網。它也可以記錄很多你曾經經歷但不曾記得的,比如十年前的照片等,它都可以幫你記錄下來。在這樣的前提下,手機的功能會發(fā)生越來越大的轉變,手機的角色也會發(fā)生越來越大的轉變,大家的很多信息,比如照片、語音、短信都在手機里面,有一天它可能成為你的一部分。我們追求的是整個AI成為個人的生活助手,現(xiàn)在有人臉識別,情緒識別,未來對朋友關系的識別,心情/感情的識別,這些在未來都能夠逐步實現(xiàn)。

    端側的AI帶來更好的服務,比如服務更貼心、體驗更個性、交互更自然。它也面臨著實質性的問題,還有大量挑戰(zhàn),因為當前大量模型都是在云端訓練和在云端做推理,在手機上去跑一個模型,手機上的容量和Power都非常有限,我們可以在云上跑一個1G的模型,其實現(xiàn)在很多圖像模型至少在百兆以上,但在手機上,是無法跑一個超大的模型的;另一個是功耗Power有限,比如攝像頭打開有很大的功耗,如果跑的時間過長會導致手機過熱、電源消耗快。大家不要小看人臉識別的模型,因為安全性和性能的要求,人像識別類的模型大多是在端側的,這對端側AI提出很大的要求和挑戰(zhàn);很多時候我們把做好的模型通過壓縮把它壓到很小,讓它的運行時間更短、功耗更小。當然未來我們還有更多的交互模型會放在手機里。我們大概有二三十個特性,有將近六七十個模型,設想將來有成百上千個算法,模型手機就撐爆了?,F(xiàn)在調一個模型還是有難度的,大量的工作使得這個領域的門檻還是蠻高的,對能力的要求就不用說了,但是我覺得現(xiàn)在的博士還是很強的,基本上一個人能獨當一面,所以現(xiàn)在這個時代還是很不錯的,給我們創(chuàng)造了非常好的人才供給,所以這兩年AI的技術發(fā)展是非??斓?。

    華為HiAI攜手伙伴加速人工智能產業(yè)成熟

    熟悉華為在端側的戰(zhàn)略領域的人都知道,去年華為Mate10發(fā)布的時候,發(fā)布了麒麟970處理器的套片,也是業(yè)界第一個發(fā)布帶神經網絡芯片的手機。華為終端智能(Mobile AI)從芯到端到云是完整的一套體系架構。我們的模型有些在端側運行,有些在云端運行,整個的策略和協(xié)同都是由整套體系架構來保證的。

    這套體系架構整體分為三層。在最下面的芯片這層,開放了DDK的接口,讓合作伙伴可以用華為麒麟970的神經網絡芯片能力進行端側模型的加速,這個模型在性能加速方面,單模型可以做到10-25倍的加速,能耗比可以做到25-50倍的能耗提升。

    往上封裝了HiAI Engine,這是華為終端自有特性的算法模型封裝,行業(yè)創(chuàng)新公司可以基于華為包裝的這層能力,不用自己去做模型,也避免模型的重疊。最上面一層是云,通過云提供大量三方原子化服務接入的生態(tài)。

    HiAI Engine提供的ASR、CV、NLU的能力叫感知能力。除了感知之外,還要知道和理解用戶想要做什么,也就是決策系統(tǒng)和認知推理。知道用戶的意圖和目的,才能推薦更精準地服務。比如說華為手機上收到一條快遞的短信,在客戶允許的情況下,它能自動把這條短信識別出來,提醒用戶有一個快遞到了,這就屬于認知領域的范疇。

    華為跟歐洲的一家公司合作,將他們的圖像風格轉換應用在神經網絡芯片上加速,整個處理性能大概提高了300%,也就是3倍以上,但是它在整個風格變換渲染過程中有很多傳統(tǒng)圖像處理的階段,所以真正算法的提升要比3倍還高。

    在HiAI Engine開放方面,已經舉辦了八次公開課,這是從合作伙伴那邊收集來的需求,大家希望能夠在CV、ASR、NLU方面跟華為合作一些業(yè)務,包括直播和社交等等。

    已經開放出來的將近30多個AI應用接口,包括人臉識別、手勢、人像分割,大家在華為接口都可以做二次分發(fā)。跟隨著這些接口,還發(fā)布一套IDE,這套IDE可以直接集成到Android Studio。開放的API接口,是簡單的JSON和JAVA,兩三行代碼就可以實現(xiàn),而且可以遠程連接到華為手機上模擬調測,即使用戶手里沒有華為手機也可以進行功能的模擬和調測。

    每一個功能都有示例代碼,從代碼里面可以形成自己的核心代碼,這是非常方便的,只要稍作修改,加上業(yè)務邏輯,就可以快速地開發(fā)編譯成一個APP。

    面向未來,手機跟大家的生活和工作越來越貼近,我們希望在手機側提供更多更好的AI的交互和服務,能夠更快、更簡單地實現(xiàn)多贏,所以提供了一個開發(fā)者的平臺。

中傳動網版權與免責聲明:

凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.treenowplaneincome.com)獨家所有。如需轉載請與0755-82949061聯(lián)系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯(lián)網或業(yè)內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發(fā)表之日起一周內與本網聯(lián)系,否則視為放棄相關權利。

伺服與運動控制

關注伺服與運動控制公眾號獲取更多資訊

直驅與傳動

關注直驅與傳動公眾號獲取更多資訊

中國傳動網

關注中國傳動網公眾號獲取更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0
往期雜志
  • 2024年第1期

    2024年第1期

    伺服與運動控制

    2024年第1期

  • 2023年第4期

    2023年第4期

    伺服與運動控制

    2023年第4期

  • 2023年第3期

    2023年第3期

    伺服與運動控制

    2023年第3期

  • 2023年第2期

    2023年第2期

    伺服與運動控制

    2023年第2期

  • 2023年第1期

    2023年第1期

    伺服與運動控制

    2023年第1期