《2021十大人工智能趨勢》來了!

時間:2021-06-11

來源:網(wǎng)絡轉(zhuǎn)載

導語:6月5日,以“交叉、融合、相生、共贏”為主題的2021全球人工智能技術大會(GAITC 2021)在杭州舉行。會上,騰訊優(yōu)圖聯(lián)合廈門大學人工智能研究院共同發(fā)布《2021十大人工智能趨勢》(以下簡稱“趨勢報告”),基于雙方長期對人工智能尤其是計算機視覺的研究洞察,對自動深度學習、無監(jiān)督/弱監(jiān)督學習、3D視覺技術等AI方向發(fā)展趨勢進行了預測。

  趨勢報告顯示,越來越多的人工智能企業(yè)發(fā)現(xiàn)數(shù)據(jù)的標注開始成為抬高交付成本、制約效果提升的主要因素之一,不斷強化無監(jiān)督/弱監(jiān)督學習由量變到質(zhì)變,將助推企業(yè)從前期的迅速擴張到穩(wěn)定期高效化運作的新階段;AI與數(shù)字內(nèi)容產(chǎn)業(yè)的深度耦合,也將有希望為行業(yè)釋放更大的科技勢能,構(gòu)筑數(shù)字內(nèi)容生成新范式。

  另外,自動機器學習的自動化程度與可解釋性得到進一步提升、3D視覺技術淡化虛實邊界助力產(chǎn)業(yè)消費升級、人工智能內(nèi)核芯片向類腦神經(jīng)計算方向演進等趨勢,也成為趨勢報告的關注重點。

  以下為《2021十大人工智能趨勢》詳細內(nèi)容:

  1、自動機器學習的自動化程度與可解釋性得到進一步提升

  自動機器學習(AutoML)目前已經(jīng)在多個領域中初步實現(xiàn)對機器學習方法的自動化設計過程,但其仍然存在自動化程度不足,可解釋性不強的問題。如神經(jīng)網(wǎng)絡結(jié)構(gòu)搜索(NAS)在一些應用領域中取得了可以與人類機器學習專家可比較的水平,然而現(xiàn)有的NAS方法實際需要基于人工設計的神經(jīng)網(wǎng)絡基礎結(jié)構(gòu)。此外,AutoML的自動化過程往往被認為是一種 “黑箱”,缺乏可解釋性。

  今后自動化程度及可解釋性仍然是AutoML研究的熱點問題,通過提高AutoML中的超參數(shù)選擇,特征表示與機器學習算法的確定和神經(jīng)網(wǎng)絡結(jié)構(gòu)搜索的自動化程度及可解釋性,AutoML將實現(xiàn)對機器學習涉及的每個環(huán)節(jié)的真正的自動化設計過程。AutoML整個體系架構(gòu)的日趨完善,將推動新一代普適性AutoML平臺的建設,并實現(xiàn)機器學習的大眾化。

  2、無監(jiān)督/弱監(jiān)督學習逐漸成為企業(yè)降本增效新利器

  在過去的幾年中,深度學習所取得的巨大成功離不開大規(guī)模標注的數(shù)據(jù)集。大規(guī)模標注的背后,是傳統(tǒng)的監(jiān)督學習對于每一個訓練樣本完備標簽的要求。隨著業(yè)務規(guī)模的不斷擴大,越來越多的企業(yè)發(fā)現(xiàn)數(shù)據(jù)的標注開始成為抬高交付成本、制約效果提升的主要因素之一。

  在此背景下,無監(jiān)督學習和弱監(jiān)督學習通過不使用標簽或減少對標簽數(shù)量、質(zhì)量的要求來迅速降低深度模型對于數(shù)據(jù)的標注需求,使得原本無法利用的數(shù)據(jù)如今都可以加入到模型的訓練中去,進而由量變引發(fā)質(zhì)變。在NLP領域,基于Transformer的無監(jiān)督訓練模型已持續(xù)霸榜各種NLP任務數(shù)據(jù)集;在CV領域,最新的MPL方法也通過額外的無標注數(shù)據(jù)集首次將ImageNet的Top-1分類準確率提升到了90%+的水平。

  可以預見的是,將有越來越多的人工智能企業(yè)會面臨從前期的迅速擴張到穩(wěn)定期高效化運作的新階段,而在這個過程中,無監(jiān)督/弱監(jiān)督學習無疑將成為他們過渡到這個階段的重要手段之一。

  3、3D視覺技術助力產(chǎn)業(yè)消費升級,淡化虛實邊界

  作為視覺AI領域多年熱點研究方向之一,3D視覺技術的核心任務是對三維空間、物體及環(huán)境進行真實還原與重建。隨著相關算法與硬件計算能力的不斷升級, 3D視覺算法效果得到大幅提升,三維幾何重建更加精細,表面紋理重建更加清晰,帶來更加逼真的視覺觀感。

  近年來,諸多3D視覺研究成果為低成本高質(zhì)量的3D內(nèi)容生成提供了良好技術支撐,基于3D虛擬形象的舞臺演出、直播帶貨、教育互動等應用層出不窮,成為AI內(nèi)容產(chǎn)業(yè)全新發(fā)展方向。以此為基礎,結(jié)合5G時代流量帶寬的全面升級,帶有交互功能的3D虛擬現(xiàn)實、增強現(xiàn)實、混合現(xiàn)實的3D視覺應用將用戶體驗向真實與虛擬的完美融合進一步邁進。

  用戶會因為虛擬偶像生動自然的舞臺表演進行打賞,會由于虛擬主播“賣力”地帶貨促銷而下單購買,而線上平臺則依靠3D視覺技術大大降低內(nèi)容制作和IP運營成本,最終帶來社會商業(yè)發(fā)展模式與個人消費習慣的顛覆與變革。展望未來,3D視覺技術將持續(xù)在包括游戲娛樂、影視制作、電商直播、醫(yī)療整形等眾多領域廣泛應用,虛擬與現(xiàn)實的邊界將不斷淡化。

  4、多模態(tài)融合加速AI認知升維

  深度學習在多個人工智能的細分領域(如視覺,自然語言處理等)已日趨成熟化和規(guī)?;?,然而要真正實現(xiàn)通用人工智能,必然要將這些細分領域各自所針對的信息模態(tài)整合利用,即多模態(tài)融合。多模態(tài)融合的目標是建立在圖像、文字、語音等的多模態(tài)信息識別的基礎上,實現(xiàn)不同模態(tài)信息的統(tǒng)一表征框架,從而起到1+1>2的作用。

  典型的場景之一是通過圖文語音聯(lián)合識別,實現(xiàn)對隱晦和暗示性,招嫖廣告,兒童不良表情包等圖文混合內(nèi)容識別,支持審核業(yè)務深度打擊不良內(nèi)容。除了圖文融合等跨域模態(tài)融合,同域內(nèi)的不同信息維度同樣可以融合,如隨著深度生成技術的發(fā)展,當前的人臉識別除了傳統(tǒng)的RGB圖外,還需要融合深度圖、紅外圖等信息來更好的防御越來越多元化的人臉偽造攻擊,實現(xiàn)更強的人臉防御。

  隨著人工智能認知能力的提升,多模態(tài)融合也將會從圖文等實質(zhì)性模態(tài),逐漸拓展到如物理關系,邏輯推斷,因果分析等知識性模態(tài),從感知智能邁向認知智能。

  5、人工智能推動數(shù)字內(nèi)容生成向新范式演進

  隨著數(shù)字文化產(chǎn)業(yè)的蓬勃發(fā)展,尤其是二次元文化滲透出圈,數(shù)字內(nèi)容產(chǎn)業(yè)面臨新一輪的需求升級,伴隨著5G商業(yè)化進程的不斷加深,多元化、精品化的優(yōu)質(zhì)數(shù)字內(nèi)容將面臨更快的消費節(jié)奏,與此同時,供給側(cè)仍存在巨大的產(chǎn)能缺口,數(shù)字內(nèi)容產(chǎn)業(yè)正處于勞動密集型向科技密集型的轉(zhuǎn)型階段。

  AI與數(shù)字內(nèi)容產(chǎn)業(yè)的深度耦合,將有希望為行業(yè)釋放更大的科技勢能,以GPT-3、DALL-E為代表的AI技術,已在文本、語音、圖像、視頻等內(nèi)容生成中取得了令人驚艷的結(jié)果,然而在精確性、泛化性、合理性方面仍然面臨挑戰(zhàn),目前的前沿研究一方面探索從模型結(jié)構(gòu)(自動化搜索等),訓練形式(無監(jiān)督對比學習等)等方面提升精度效果;另一方面引入知識圖譜領域知識,向機器介紹常識和其他特定領域的知識進而提升常識推理效果。

  伴隨著技術的持續(xù)升級演進,我們預見AI將逐步在數(shù)字內(nèi)容生成領域釋放引擎級的影響力,在內(nèi)容、平臺、技術多方合力引導下,構(gòu)筑數(shù)字內(nèi)容生成新范式。

  6、邊緣計算與人工智能加速融合

  近年來,隨著深度學習算法的迅猛發(fā)展,計算機視覺、自然語言處理、搜索推薦廣告等各種領域的任務性能得到不斷刷新。同時,隨著邊緣智能設備的廣泛普及和硬件改進,基于深度學習的人工智能技術在邊緣端應用落地成為了可能。

  然而,在邊緣端上部署深度學習模型具有很大的難度。其主要挑戰(zhàn)表現(xiàn)在,邊緣端等智能設備在計算、存儲、功耗等方面有很大的限制。因此,邊緣端模型必須滿足低計算復雜度、小模型尺寸、低模型功耗等要求。未來將趨向硬件友好型的剪枝加速。根據(jù)邊緣硬件的CPU類型來設計特定的網(wǎng)絡稀疏化模式,適配不同硬件的模型壓縮與優(yōu)化加速技術是未來研究熱點趨勢。其次,基于自動化的1-bit量化方法有上百倍的理論性能提升,因此也是未來研究熱點趨勢。

  7、人工智能內(nèi)核芯片向類腦神經(jīng)計算方向演進

  人工智能內(nèi)核芯片已經(jīng)成為人工智能時代的關鍵技術之一,在某些領域中的具體任務上人工智能內(nèi)核芯片能夠?qū)崿F(xiàn)超越人腦的表現(xiàn),但針對人工智能內(nèi)核芯片的研究依然落后于人工智能的發(fā)展,人工智能內(nèi)核芯片無法同時滿足多種人工智能算法的加速要求,并且面對各種新型人工智能技術不斷涌現(xiàn)的局面,人工智能內(nèi)核芯片與人腦相比其自我學習能力與可擴展性存在明顯不足。

  未來人工智能內(nèi)核芯片將在結(jié)構(gòu)上更接近人腦的神經(jīng)構(gòu)造,獲得類神經(jīng)計算的能力,通過不斷整合最新的人工智能技術,定制型人工智能內(nèi)核芯片將逐漸演變?yōu)橥ㄓ眯腿斯ぶ悄軆?nèi)核芯片,在提高自我學習能力的同時,實現(xiàn)對不同人工智能技術在不同任務上的加速計算,從而推動人工智能內(nèi)核芯片實現(xiàn)真正的落地。

  8、算法公平性研究推動AI應用走向普惠無偏見

  由于數(shù)據(jù)偏差、算法本身缺陷、甚至是人為偏見的存在,現(xiàn)有AI算法普遍存在對于某些特定人群效果不公平的"歧視性現(xiàn)象"。隨著AI算法在社會各行業(yè)的廣泛落地應用,作為輔助人們決策的重要工具,算法的公平性問題正受到越來越多的關注。過去的幾年業(yè)界已在逐步探索一些針對性的解決方案,包括構(gòu)建更公正的數(shù)據(jù)集、算法訓練中引入公平性約束損失、提高機器學習算法的可解釋性等。

  但就整體而言,當前公平性研究在精度和公平性的平衡、不同場景的泛化性有效性等問題上正處于方興未艾的階段。隨著歐盟發(fā)布《人工智能白皮書》、《人工智能倫理:問題和倡議》,中國發(fā)布《協(xié)同落實人工智能治理原則的行動建議》,人工智能的治理正成為一個愈加熱門的議題,而算法的公平性正是人工智能治理的關鍵問題。我們預見算法公平性的研究將持續(xù)深化,在人臉識別等最廣泛的AI應用領域取得突破,為不同人群帶來更加普惠無偏見的效果。

  9、隱私保護AI落地實用幫助算法可持續(xù)進化

  人工智能和機器學習算法的廣泛應用,在為人們提供便利的同時,也帶來了極大的隱私泄露風險。這種隱私泄露包括用戶數(shù)據(jù)在授權(quán)范圍以外被處理共享、機器學習算法訓練后存在數(shù)據(jù)記憶等現(xiàn)象。AI算法開發(fā)中的數(shù)據(jù)隱私保護問題受到的關注以及監(jiān)管日益增長,美國于2020年生效《加利福利亞消費者隱私法案》,中國于2020年公布《個人信息保護法(草案)》。

  針對機器學習中上述隱私保護問題,研究工作近年來逐步深入走向成熟,發(fā)展出了數(shù)據(jù)匿名化、聯(lián)邦學習、差分隱私等一系列方法。我們預見能夠保護用戶數(shù)據(jù)隱私的更加靈活高效的AI學習方法將在金融、醫(yī)療、社交等場景實用化落地,消減用戶的隱私擔憂,幫助AI算法在場景中可持續(xù)地進化。

  10、人工智能技術向安全智能方向邁進

  隨著人工智能技術在各行各業(yè)的廣泛應用,濫用或惡意破壞人工智能系統(tǒng)將會給社會帶來巨大的負面影響。近年來算法后門攻擊、對抗樣本攻擊、模型竊取攻擊等針對人工智能算法的攻擊技術持續(xù)發(fā)展,通過篡改構(gòu)造特殊數(shù)據(jù)誘騙人工智能應用產(chǎn)生不可信的錯誤結(jié)果,帶來了更大的算法安全風險,因此保障人工智能應用安全可靠的需求日漸迫切。未來人工智能技術將向著安全智能方向持續(xù)演化,一方面從算法的可解釋性入手提升模型的魯棒性,另一方面化被動為主動,通過主動安全檢測機制對各類攻擊進行偵測與攔截,最終實現(xiàn)人工智能可用性與可信性雙軌并重的現(xiàn)實需求,推動人工智能技術在更廣泛領域的安全落地。

中傳動網(wǎng)版權(quán)與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.treenowplaneincome.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關權(quán)利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅(qū)與傳動公眾號獲取更多資訊

關注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0