人工智能AI計算機視覺
一場地震災(zāi)難發(fā)生后,專業(yè)救援人員組成的隊伍會奔赴現(xiàn)場,在廢墟中搜尋生命體征、實行醫(yī)療救護、呼叫救援。
但在斯坦福大學(xué)首席人工智能科學(xué)家李菲菲(Fei-FeiLi)的想象中,對事件率先做出響應(yīng)的并不是紅十字會的志愿者或醫(yī)護人員,而是那些能洞悉周邊環(huán)境并響應(yīng)人們需求的智能機器人,它們將竭盡所能拯救盡可能多的人。對這一場景背后所涉及的技術(shù),李已經(jīng)做了大量思考和研究,她認為如果計算機能夠掌握最復(fù)雜的人類視覺認知能力的時候,這項技術(shù)就離我們不遠了。
目前,由李及其帶領(lǐng)的斯坦福大學(xué)人工智能實驗室,在這項技術(shù)上取得了一些進展,這多虧了在2009年建立的擁有超過1500萬數(shù)字圖像的數(shù)據(jù)庫。此后的每一年,研究人員利用該數(shù)據(jù)庫組建了大型視覺識別比賽,目的是開發(fā)出可以教會計算機識別、理解圖像內(nèi)容的算法。2014年,參與者設(shè)計的軟件程序識別對象和動作的準確率幾乎是往年的兩倍,這得益于更快的計算能力和更精煉的代碼。2014年末,李和她的學(xué)生研發(fā)出首個能夠用類似人類語句來描述其所見圖像的計算機視覺模型。
她認為,計算機視覺是所有人工智能的關(guān)鍵。“理解并建立視覺系統(tǒng),才能真正理解智能,對于‘看’,我的意思是理解,而不是簡單的像素記錄。”
新型智能
人工智能領(lǐng)域的科學(xué)家們,還有在谷歌、Facebook、微軟等企業(yè)任職的研究人員,他們在計算機視覺技術(shù)中投入大量資源的原因很簡單:人類利用一半的大腦進行視覺處理,這一認知能力經(jīng)歷了5.4億年的發(fā)展演變。在李看來,“這里(大腦)比海灣地區(qū)的住房更值錢”。視覺在我們認識世界的過程中扮演了至關(guān)重要的角色,很難想象未來的智能計算機會沒有視覺能力。任何像樣的無人駕駛汽車最終都需要具備分辨的能力,假如路上有一個大石頭和一個小的紙袋,它就應(yīng)該用剎車、轉(zhuǎn)向來避開石頭,選擇性地忽略紙袋。
如今,計算機可以識別出照片中的貓或汽車的形狀、年代等,但是要想讓計算機像人一樣通過觀察和推理來理解內(nèi)容,還需要進行大量的科研工作。比如,同樣的球棒,在球場和犯罪現(xiàn)場就有完全不同的含義。李表示:“我們實驗室下一步的任務(wù)是研發(fā)出滿足基本視覺任務(wù)的認知能力,例如對場景、人類行為、關(guān)系、推理和講故事等的理解。”
照亮人類的“暗物質(zhì)”
教會計算機如何去“看”已經(jīng)遠遠高于對出現(xiàn)在我們物理世界的物質(zhì)的識別。更好的機器視覺應(yīng)該可以洞悉和透露我們都不知道的細節(jié)。互聯(lián)網(wǎng)每一天都在產(chǎn)生所謂的數(shù)字時代的暗物質(zhì)——數(shù)以萬億計的圖像和視頻。網(wǎng)頁中有超過85%的內(nèi)容是多媒體,這是一大堆混亂的爛攤子。“我們有理由去理解它們,對我們生活、日常活動、社會關(guān)系(不論是個人還是社會)的記錄,都在那些內(nèi)容中。”
這些對人類的視覺描述的增長速度超出我們的想象。過去30天內(nèi)生成的圖片和視頻總量,比從人類文明初期所有的圖像加起來都大。對人類來說,記錄下所有的這些數(shù)據(jù)是不可能的,但是對可以進行模式識別,并用自然語言將視覺內(nèi)容描述出來的智能機器而言是可行的,這些機器可能成為未來的歷史學(xué)家。
新興的應(yīng)用
李表示計算機視覺最終會影響所有事情,從監(jiān)測和應(yīng)對氣候變化所帶來的影響,到構(gòu)建智能家居,但最令她感到興奮的是在醫(yī)學(xué)領(lǐng)域的應(yīng)用。“當日常護理可以完全依賴人工智能的時候,也就是降低成本、提高護理水平的時候。”
這也難怪李和她斯坦福大學(xué)計算機視覺實驗室的學(xué)生會和斯坦福大學(xué)醫(yī)學(xué)院進行合作,利用計算機視覺緩解護士們?nèi)粘5闹茍D任務(wù),在美國護士們平均每天要在該項工作中耗費45分鐘。在斯坦福大學(xué)醫(yī)院的重癥監(jiān)護室,臨床醫(yī)生每兩個小時就會對病危患者進行檢查,并對其健康狀況在-4到4的范圍內(nèi)進行打分。
李表示,她希望建立一個可以持續(xù)監(jiān)測病患的系統(tǒng)(例如對移動性、疼痛程度、靈敏度等進行監(jiān)測),不僅可以有效分擔護士和醫(yī)生的任務(wù),還可以為負責該病患的臨床醫(yī)生提供更詳細、準確、客觀的數(shù)據(jù)。
視覺實驗室還與舊金山護士之家開展合作,致力于探索如何利用人工智能幫助老年人更好地獨立生活。
多樣性發(fā)展
和所有的創(chuàng)新技術(shù)一樣,計算機視覺很有可能被別有目的的人利用,進行高級別的視覺監(jiān)控。李對此并不避諱,“每項技術(shù)都有可能成為邪惡的幕后推手,但作為一個科學(xué)家,你必須具備這樣的社會意識并清醒的認識到其潛在的風(fēng)險。”
這種風(fēng)險與其職業(yè)生涯息息相關(guān),從法人團體到學(xué)術(shù)界都缺乏技術(shù)研究和人工智能的多樣性。長期解決多樣性問題有助于研究朝著積極的方向發(fā)展,有效的規(guī)避風(fēng)險。“我們需要在人工智能的教育和研究過程中為其注入包含有生活中各行各業(yè)的人文主義。”借此吸引社會中不同的群體關(guān)注該領(lǐng)域,并提供必要的制衡。
“從概念誕生之日到技術(shù)建立、實施和調(diào)整之時,人類的意識至關(guān)重要”,她說道。但在今天事情并不是這樣的,她是斯坦福大學(xué)人工智能實驗室的帶頭人,也是這15人中唯一的全職女教師。此外,F(xiàn)acebook的39人人工智能研究團隊中也僅有兩名女性。李試圖改變這一現(xiàn)狀,她為同在人工智能領(lǐng)域工作的女性舉辦下午茶集會,并針對斯坦福大學(xué)9年紀的女生們組織人工智能夏令營。她承認,她喜歡自己的研究工作,多樣性的進展還有很長的路要走。
更多資訊請關(guān)注工業(yè)機器人頻道