大數(shù)據(jù)與人工智能發(fā)展帶來思考

時(shí)間:2017-10-20

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:10月12日,第七屆中國(guó)智能產(chǎn)業(yè)高峰論壇在佛山開幕,在第一天的主論壇上,北京拓爾思信息技術(shù)股份有限公司副董事長(zhǎng)、總裁施水才發(fā)表了主題為《大數(shù)據(jù)和人工智能發(fā)展的思考》的精彩演講。

10月12日,第七屆中國(guó)智能產(chǎn)業(yè)高峰論壇在佛山開幕,在第一天的主論壇上,北京拓爾思信息技術(shù)股份有限公司副董事長(zhǎng)、總裁施水才發(fā)表了主題為《大數(shù)據(jù)和人工智能發(fā)展的思考》的精彩演講。

在演講中,施水才先生從自身多年大數(shù)據(jù)技術(shù)和服務(wù)領(lǐng)導(dǎo)者角色的角度,介紹了旗下利用大數(shù)據(jù)技術(shù)推出的數(shù)據(jù)增值服務(wù)平臺(tái),并得出了“數(shù)據(jù)——信息——知識(shí)——智能——智慧”的價(jià)值提升路徑。從大數(shù)據(jù)、云服務(wù)到人工智能,施水才為嘉賓鋪設(shè)了一條如何利用大數(shù)據(jù)去實(shí)現(xiàn)人工智能增值的道路,有很大的參考價(jià)值。

以下是施水才先生的演講整理稿:

大家上午好。非常感謝中國(guó)人工智能學(xué)會(huì)邀請(qǐng)我在大會(huì)上做分享報(bào)告。今天我想給大家分享一下對(duì)于大數(shù)據(jù)和人工智能產(chǎn)業(yè)的發(fā)展思考。

我想講的第一點(diǎn)是我認(rèn)為把大數(shù)據(jù)和人工智能產(chǎn)業(yè)進(jìn)行一些比對(duì),把這兩個(gè)事情放到一起比對(duì)是非常有意義的。第二點(diǎn)想講的,到底我們是人工智能+行業(yè),還是行業(yè)+人工智能,談一下我的理解和認(rèn)識(shí),第三點(diǎn)我覺得我們需要突破人工智能現(xiàn)在非常強(qiáng)調(diào)3個(gè)要素,就是計(jì)算能力、數(shù)據(jù)和算法,我認(rèn)為對(duì)于未來人工智能的研究和應(yīng)用,僅有這三點(diǎn)是不夠的,應(yīng)該有其他重要的因素需要加進(jìn)來。第四點(diǎn)我想探討的是我們現(xiàn)在在人工智能的幾個(gè)方向里面,哪一些還有大的機(jī)會(huì),來讓我們創(chuàng)新、創(chuàng)業(yè)、賺錢,最后講一講我們自己基于NLP平臺(tái)的一些人工智能應(yīng)用實(shí)踐。

大數(shù)據(jù)和人工智能產(chǎn)業(yè)的對(duì)比

對(duì)比大數(shù)據(jù)和人工智能產(chǎn)業(yè)的發(fā)展是有啟發(fā)的。因?yàn)槿斯ぶ悄艿陌l(fā)展和數(shù)據(jù)密不可分,而且目前人工智能發(fā)展所取得的成就大部分和大數(shù)據(jù)密切相關(guān),因此觀察大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展對(duì)人工智能產(chǎn)業(yè)發(fā)展很有意義,同時(shí)我們認(rèn)為數(shù)據(jù)驅(qū)動(dòng)的商業(yè)(DataDrivenBusiness)比智能驅(qū)動(dòng)的商業(yè)更符合產(chǎn)業(yè)的本質(zhì),實(shí)際上大數(shù)據(jù)產(chǎn)業(yè)的落地能力是強(qiáng)于人工智能的,所以大數(shù)據(jù)產(chǎn)業(yè)發(fā)展中出現(xiàn)的問題對(duì)人工智能產(chǎn)業(yè)發(fā)展很有意義。

大數(shù)據(jù)的發(fā)展有幾個(gè)方面對(duì)人工智能的發(fā)展有啟發(fā)。包括數(shù)據(jù)的重要性,數(shù)據(jù)質(zhì)量的重要性,應(yīng)用場(chǎng)景的重要性,行業(yè)知識(shí)的重要性、政策法規(guī)的重要性,以及變現(xiàn)的模式的參考意義。大數(shù)據(jù)從2010年在美國(guó)白宮首先開始制定一些政策,到2012年我們國(guó)家開始熱起來,這幾年出臺(tái)了很多政策規(guī)范,甚至搞了很多園區(qū),但是我們現(xiàn)在發(fā)現(xiàn)整個(gè)大數(shù)據(jù)產(chǎn)業(yè)仍然處于非常早期的階段。為什么這么說?第一,它在哪些方面推動(dòng)了產(chǎn)業(yè)的變革?第二,誰賺到錢了?現(xiàn)在基本上只有互聯(lián)網(wǎng)的大公司通過推薦精準(zhǔn)化營(yíng)銷、電子商務(wù)等等賺到錢了,但是我們大量從事產(chǎn)業(yè)大數(shù)據(jù)的企業(yè)大部分還在燒錢,行業(yè)也沒有從大數(shù)據(jù)中收益和發(fā)生大的產(chǎn)業(yè)變革,仍然處于非常早期階段。人工智能也是一樣的,大部分的AI企業(yè)仍處于投資和燒錢的階段。

再細(xì)化一下,我們看看影響整個(gè)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的4個(gè)要素:數(shù)據(jù)開放、技術(shù)研發(fā)、產(chǎn)業(yè)生態(tài)、法律法規(guī)??傮w上講,目前大數(shù)據(jù)產(chǎn)業(yè)發(fā)展非常早期,仍然是大數(shù)據(jù)投資和創(chuàng)業(yè)的良機(jī),在產(chǎn)業(yè)生態(tài)上主要的特征是壟斷和新的數(shù)據(jù)孤島,大數(shù)據(jù)創(chuàng)業(yè)公司仍需3-5年才能實(shí)現(xiàn)規(guī)模盈利,大部分在持續(xù)的燒錢,2017-2018年產(chǎn)業(yè)整合趨勢(shì)明顯。在數(shù)據(jù)方面,互聯(lián)網(wǎng)大企業(yè)的數(shù)據(jù)霸權(quán)主義、政府?dāng)?shù)據(jù)公開的艱難(在國(guó)際上很落后,60名開外),行業(yè)和企業(yè)數(shù)據(jù)的難以獲得以及灰色數(shù)據(jù)灰色產(chǎn)業(yè)鏈,以及個(gè)人隱私問題都非常的突出,我們國(guó)家每年數(shù)據(jù)交易的市場(chǎng)是500個(gè)億以上,但是合法的只有10%左右,90%都是灰色數(shù)據(jù)鏈,所以導(dǎo)致最近公安查,說很多大公司被抓起來了,個(gè)人隱私問題非常突出,要破解數(shù)據(jù)的魔咒,需要在法律法規(guī)和產(chǎn)業(yè)生態(tài)兩個(gè)角度去破局。

除了數(shù)據(jù)及數(shù)據(jù)的質(zhì)量外,應(yīng)用場(chǎng)景是非常重要的,大數(shù)據(jù)的4個(gè)V不重要,Hadoop/Spark不重要,重要的是應(yīng)用場(chǎng)景,那么對(duì)AI來說也是一樣的,因?yàn)閷?shí)際上我們看到大數(shù)據(jù)和AI的熱門應(yīng)用領(lǐng)域?qū)嶋H上重合度很高:金融、健康醫(yī)療、教育、在線廣告、情報(bào)分析……應(yīng)用場(chǎng)景和行業(yè)密切相關(guān),主要是垂直化和行業(yè)化,一旦進(jìn)入行業(yè),你就會(huì)發(fā)現(xiàn),很多問題來了,所以我們說人工智能發(fā)展僅僅強(qiáng)調(diào)數(shù)據(jù)、算力、算法是不夠的。

政策法律也非常重要,在互聯(lián)網(wǎng)時(shí)代,我們國(guó)家互聯(lián)網(wǎng)發(fā)展為什么快?其中一條人多,人口紅利,還有一條非常重要規(guī)則沒那么嚴(yán),政府和行業(yè)對(duì)互聯(lián)網(wǎng)的支持比較多,企業(yè)層面有時(shí)甚至有點(diǎn)蔑視規(guī)則。但是大數(shù)據(jù)和人工智能時(shí)代,像互聯(lián)網(wǎng)早期那樣野蠻發(fā)展已經(jīng)行不通了?,F(xiàn)在數(shù)據(jù)開放和隱私保護(hù),從個(gè)人隱私到人身安全,因?yàn)楦悴缓脮?huì)死人的。

小節(jié)一下,通過對(duì)比大數(shù)據(jù)和人工智能產(chǎn)業(yè)的發(fā)展,我們可以得到如何幾個(gè)結(jié)論:人工智能產(chǎn)業(yè)仍處于非常早期的階段;數(shù)據(jù)的重要性不容置疑,但問題多多;應(yīng)用才是驅(qū)動(dòng)力;垂直行業(yè)才是大部分參與者的機(jī)會(huì)所在。

人工智能+行業(yè)or行業(yè)+人工智能

今天想和大家分享的第二點(diǎn)是關(guān)于到底是“人工智能+行業(yè)”還是“行業(yè)+人工智能”。我的基本看法是行業(yè)+人工智能仍然是智能產(chǎn)業(yè)發(fā)展的主流。我們覺得“行業(yè)+人工智能”可能占到90%,“人工智能+行業(yè)”可能只占到10%。區(qū)別在哪里?人工智能+行業(yè)是創(chuàng)造新模式,更多表現(xiàn)在以前這個(gè)行業(yè)不成熟,或者沒有現(xiàn)有的很好的商業(yè)模式,比如像自動(dòng)駕駛;而行業(yè)+人工智能是對(duì)用人工智能技術(shù)對(duì)行業(yè)進(jìn)行變革和改造,要么降低成本,要么提高決策和管理水平。比如法律啊、教育啊、金融啊。很對(duì)AI的新技術(shù)在消費(fèi)領(lǐng)域和工業(yè)領(lǐng)域的應(yīng)用也不一樣,比如消費(fèi)領(lǐng)域的人臉識(shí)別、美顏相機(jī)在工業(yè)領(lǐng)域可能是身份認(rèn)證、銀行開戶、安防監(jiān)控、商業(yè)分析;消費(fèi)領(lǐng)域的語音識(shí)別和輸入法技術(shù)可能是智能客服應(yīng)用,深度學(xué)習(xí)和圖像識(shí)別在工業(yè)領(lǐng)域可能是智能分揀和安檢應(yīng)用。

如果90%的機(jī)會(huì)在于“行業(yè)+人工智能”,那么錢、數(shù)據(jù)和算法就是不是決定性的因素,如果錢是決定性的因素,那未來也就不會(huì)有什么創(chuàng)新了。行業(yè)知識(shí)和行業(yè)專家是壁壘,所以說大公司壓迫下的創(chuàng)業(yè)公司仍具有廣闊的空間,那么那些行業(yè)將實(shí)現(xiàn)AI爆發(fā)或者說受到?jīng)_擊最大呢?剛才李德毅院士說的很好,四個(gè)行業(yè),制造業(yè)、教育、金融、醫(yī)療,我非常認(rèn)同,我覺得最關(guān)鍵的是要看兩點(diǎn),一個(gè)是行業(yè)本身的成長(zhǎng)空間,就是說是否足夠大,是否未來有成長(zhǎng)性,另一個(gè)是這個(gè)行業(yè)是否依賴于人的經(jīng)驗(yàn)和知識(shí),依賴越大的,被人工智能取代的需求就越大,比如醫(yī)生,主要是專家太少。我們投資過的一個(gè)項(xiàng)目,是病理切片癌癥診斷,據(jù)說全國(guó)能看病醫(yī)生也就不到1萬個(gè),而合格的專家只有不到500個(gè),你看需求多大,大數(shù)據(jù)和人工智能可以解決這個(gè)問題,IBMWatson的思路也是一樣的。另外就是律師和金融行業(yè)的人,主要是太貴,律師一小時(shí)多少錢,金融行業(yè)動(dòng)不動(dòng)幾百萬,其實(shí)你用了大數(shù)據(jù)和人工智能后發(fā)現(xiàn),其實(shí)他們不值這么多錢。剛才李院士說制造業(yè)我國(guó)使用機(jī)器人的數(shù)量遠(yuǎn)遠(yuǎn)落后韓國(guó)日本等,主要原因我覺得還是成本問題,所以我認(rèn)為最緊迫的可能不是家政機(jī)器人之類的,而是取代高成本的人力以及人力不夠的行業(yè)。

人工智能產(chǎn)業(yè)還有一個(gè)特點(diǎn)比較鮮明的。就是他是Embedded,嵌入式的,所以可以說AI技術(shù)是一種EnablingTechnology。未來所有的企業(yè)都應(yīng)該是AI企業(yè),所以你看現(xiàn)在包括Google百度都說自己是AIAllIn。

人工智能的三要素問題

今天想和大家分享的第三點(diǎn)是關(guān)于人工智能的三要素問題?,F(xiàn)在講人工智能,就和大數(shù)據(jù)的4個(gè)V一樣,幾乎每個(gè)專家都要將人工智能三要素,數(shù)據(jù)、計(jì)算力、算法。但是真的夠了嗎。我認(rèn)為不夠,為何什么說呢,大家看看,人工智能正從計(jì)算智能、感知智能向認(rèn)知智能及創(chuàng)造智能的方向發(fā)展,認(rèn)知智能包括理解、運(yùn)用語言的能力,掌握知識(shí)、運(yùn)用知識(shí)的能力,在語言和知識(shí)上的推理能力,主要集中在語言智能即NLP。到了認(rèn)知智能這個(gè)階段光有數(shù)據(jù)、算法、和計(jì)算資源我認(rèn)為不夠的,需要什么?我認(rèn)為重要的一點(diǎn)可能還需要很多的知識(shí),需要有知識(shí)圖譜等別的很多東西,所以知識(shí)可能是第四個(gè)要素。從另外一個(gè)角度,目前人工智能三要素中對(duì)應(yīng)用場(chǎng)景沒有論及,所及基本還是從技術(shù)層面來考慮問題的,我們認(rèn)為不夠,所以應(yīng)用場(chǎng)景的問題是否可能成為第四要素?再者人共智能必須考慮人的問題,是人工+智能,人機(jī)協(xié)作的問題在很多AI場(chǎng)景中必須考慮。所以我提出一個(gè)問題,如何尋找人工智能的第四要素?

人工智能的重點(diǎn)機(jī)會(huì)和方向問題

今天想和大家分享的第四點(diǎn)是人工智能的重點(diǎn)機(jī)會(huì)和方向問題。這就是以自然語言處理即NLP為代表的認(rèn)知智能。目前AI硬件領(lǐng)域的投資很厲害,也是大公司的天下,比如GPU,F(xiàn)PGA,ASIC芯片等,在視覺領(lǐng)域的投資,也很多,特別是圖像識(shí)別啊、語音識(shí)別啊,誕生了不少獨(dú)角獸公司,技術(shù)進(jìn)步也很快,但是太多了。不是未來的投資方向。而以自然語言處理為核心的認(rèn)知智能,目前在國(guó)內(nèi)的投資及發(fā)展和美國(guó)有不少的差距。根據(jù)騰訊研究院的報(bào)告,美國(guó)在NLP領(lǐng)域的新創(chuàng)其實(shí)差不多是中國(guó)的3倍,根據(jù)烏鎮(zhèn)智庫(kù)的報(bào)告,2000-2016年,全球累計(jì)新增自然語言處理企業(yè)數(shù)據(jù)達(dá)到543家。2009年以來,美國(guó)每年新增的自然語言處理企業(yè)占當(dāng)年全球新增企業(yè)總數(shù)的比例保持在40%左右,根據(jù)調(diào)研公司CBInsights近日公布的“最值得關(guān)注的100家人工智能公司,約25%的項(xiàng)目與“自然語言處理”直接或間接相關(guān),所以說NLP已經(jīng)成為最值得關(guān)注的人工智能公司。根據(jù)福布斯精選Top50AI公司2016年融資34.15億美元,其中約16.2%的資金投向“自然語言處理”直接或間接相關(guān)。

為什么是這樣的情況呢?因?yàn)樵谀壳癆I領(lǐng)域,依托大數(shù)據(jù)和深度學(xué)習(xí),進(jìn)展最快、效果得最好的是機(jī)器識(shí)別,機(jī)器識(shí)別結(jié)合機(jī)器學(xué)習(xí)在很多AI應(yīng)用場(chǎng)景下實(shí)現(xiàn)了較好的機(jī)器智能,但是識(shí)別不等于理解,未來實(shí)現(xiàn)強(qiáng)機(jī)器智能或“智慧”,還需要解決機(jī)器理解和推理的難題,特別是自然語言理解/生成(自然語言處理技術(shù))。如何讓機(jī)器像人一樣思考,理解人類語言、用人類語言表達(dá)、感知和表達(dá)情感、進(jìn)行推理、規(guī)劃、決策、具備自學(xué)習(xí)進(jìn)化能力這些都是NLP的難題。

NLP包含的內(nèi)容也是保羅萬象,從詞法、句法、語義、篇章、語言表示等基礎(chǔ)技術(shù),到分類、聚類、情感分析、知識(shí)圖譜、機(jī)器翻譯、自動(dòng)摘要、自動(dòng)問答、信息抽取等核心技術(shù),到搜索引擎、智能客服、輿情監(jiān)控等NLP+,再到各垂直行的“行業(yè)+NLP”。早期大家認(rèn)為深度學(xué)習(xí)對(duì)NLP貢獻(xiàn)不大,這兩年有所突破,我們?cè)?個(gè)數(shù)據(jù)集上的測(cè)試表明,深度學(xué)習(xí)對(duì)自動(dòng)分類的貢獻(xiàn)還是比較大的,平均可以提高5個(gè)百分點(diǎn),所以深度學(xué)習(xí)對(duì)NLP有用,但是提高的精度還不夠。

整個(gè)在自然語言處理里面,有幾個(gè)東西我認(rèn)為現(xiàn)在非常熱,第一個(gè)就是聊天機(jī)器人或者虛擬助理。明天有一個(gè)專門的論壇講這個(gè),特別好,我在這里不多講了。為什么這樣說?因?yàn)樗撬凶匀徽Z言處理技術(shù)的集大成,而且是未來爭(zhēng)奪入口的一個(gè)焦點(diǎn),所以蘋果、微軟、臉書、亞馬遜都在搞,而且未來這些平臺(tái)都會(huì)走向開源。

總的來說國(guó)內(nèi)目前在自然語言處理的投資遠(yuǎn)遠(yuǎn)落后于對(duì)視覺處理領(lǐng)域的投資,這是我們的一個(gè)機(jī)會(huì)。但是自然語言的處理障礙壁壘更大,和行業(yè)結(jié)合得更加緊密,這是它的一個(gè)特點(diǎn)。

最后和大家分享一下我們公司基于大數(shù)據(jù)+NLP技術(shù)做的一些事情,拓爾思是一家以大數(shù)據(jù)+人工智能為發(fā)展戰(zhàn)略的創(chuàng)業(yè)板上市公司,拓爾思的人工智能的發(fā)展戰(zhàn)略,首先是AIAllin的路線,即我們所有的技術(shù)產(chǎn)品、應(yīng)用產(chǎn)品和云服務(wù)都是內(nèi)嵌AI技術(shù);第二是大數(shù)據(jù)驅(qū)動(dòng),利用大數(shù)據(jù)的技術(shù)和應(yīng)用基礎(chǔ)來支撐和驅(qū)動(dòng)AI技術(shù)和應(yīng)用的發(fā)展;第三是應(yīng)用場(chǎng)景優(yōu)先,因?yàn)闆]有業(yè)務(wù)場(chǎng)景這些技術(shù)的東西就沒有用武之地,需要應(yīng)用場(chǎng)景來前導(dǎo)拉動(dòng)和價(jià)值變現(xiàn)。當(dāng)前拓爾思AI技術(shù)主要拓展的場(chǎng)景在金融、安全、傳媒、司法、情報(bào)等垂直行業(yè)領(lǐng)域;此外,拓爾思再技術(shù)發(fā)展路徑方面強(qiáng)調(diào)兩條,第一個(gè)是云服務(wù)落地,逐步把業(yè)務(wù)都做成云服務(wù)的模式,第二條致力于垂直整合,如果不能形成垂直整合的生態(tài)閉環(huán),你就不能賺大錢,實(shí)現(xiàn)更高的盈利能力和競(jìng)爭(zhēng)門檻。同時(shí)我們也強(qiáng)調(diào)與巨人同行,技術(shù)上既采用開源開放的框架和平臺(tái),又要研發(fā)出自己專攻領(lǐng)域超越和創(chuàng)新的成果。

總結(jié),我認(rèn)為我們分析比較大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展對(duì)人工智能的產(chǎn)業(yè)發(fā)展非常有意義;第二我們認(rèn)為行業(yè)+人工智能仍然是主流,行業(yè)里有更大的空間可以供大家去創(chuàng)新和創(chuàng)造;第三面對(duì)人工智能的落地和進(jìn)一步發(fā)展需要,人工智能三要素還不夠,還需要知識(shí)作為第四要素;第四是在自然語言處理領(lǐng)域的里的創(chuàng)新機(jī)會(huì)和拓爾思在這方面應(yīng)用實(shí)踐。希望與大家共同努力,推動(dòng)我們國(guó)家人工智能產(chǎn)業(yè)特別是自然語言處理技術(shù)領(lǐng)域更快更好地發(fā)展。

更多資訊請(qǐng)關(guān)注工業(yè)機(jī)器人頻道

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.treenowplaneincome.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0