今天的IT領(lǐng)袖峰會上,馬化騰和李彥宏兩位工程師出身的IT領(lǐng)袖又碰面啦。這次的主題是:“在人工智能時代,我們是怎么挖微軟研究院的人?”
這當(dāng)然是一個玩笑,這次對話的主題是《人工智能:中國機(jī)遇與挑戰(zhàn)》,對話四方包括百度CEO李彥宏、騰訊CEO馬化騰、微軟公司全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋,還有神州數(shù)碼控股董事局主席郭為。
不過,隨著幾大巨頭的人工智能布局逐漸深入,確實他們對人才的需求也越來越多,向來被業(yè)界稱為“國內(nèi)科技圈的黃埔軍?!钡奈④浹芯吭海^續(xù)擔(dān)任人才的輸送中心。在現(xiàn)場,三位來自微軟、百度和騰訊的高管,也就此事調(diào)侃起來。
馬化騰還說,騰訊在西雅圖建了一個研究院,因為微軟的很多研究人員不愿意離開西雅圖。沈向洋也說,微軟人工智能事業(yè)部有七千多人,但還在不斷招人,因為百度和騰訊一直在挖他們的人。
為何布局人工智能?
小馬哥也是越來越重視人工智能了,最近騰訊的圍棋AI“絕藝”,也因為贏得了日本的圍棋大賽爆紅,而且跟阿爾法狗的負(fù)責(zé)人黃博士不同,騰訊做“絕藝”的團(tuán)隊,沒有一個人懂圍棋。
所以主持人也問起了小馬哥,騰訊為什么重視人工智能?
馬化騰非常謙虛地說,其實百度在人工智能走得更前,騰訊還是落后。不過他認(rèn)為,不僅是騰訊,其實在內(nèi)部,大家都在結(jié)合自己的業(yè)務(wù)去AI的研究和應(yīng)用,比如騰訊在微信中大量的人臉圖片識別,媒體廣告的精準(zhǔn)匹配。
一年前,Google阿爾法狗的論文出來的時候,騰訊的團(tuán)隊也開始去探索,后來Deepmind的論文出來之后,也有很多公司用了深度學(xué)習(xí)。他說,“絕藝”的成長,不同的在于,它一直得到了很多國家級棋手的支持和陪練,也得到了很多國家級專家的支持?!半m然今天絕藝確實獲得了一點小成功,我們不能太欣喜,畢竟是站在別人的肩膀上的,如果這個論文沒出來我們也做不出來。”
他還認(rèn)為人工智能的可怕之處在于,它可以利用后臺的云計算,自己不斷地快速學(xué)習(xí),現(xiàn)在阿爾法狗可能對圍棋的理解已經(jīng)超越了人類那么多人,就像開車一樣,你可能不需要教他怎么開車,只需要做一個模擬器,讓他自己在無數(shù)次的撞車中得到反饋,自己學(xué)習(xí),我認(rèn)為這個是值得我們思考的。
同時主持人也問李彥宏,為什么會那么早開始布局人工智能?
按李彥宏的說法,這就跟百度做搜索很有關(guān)系了。他說,百度從基因上來說,就是在做搜索,其實本質(zhì)上就是一個機(jī)器區(qū)揣測人的想法的事情。他回憶,大概是在2011年,那時陸奇還在微軟,他告訴李彥宏,微軟的深度學(xué)習(xí)部門已經(jīng)發(fā)展到可以應(yīng)用的階段了。
百度自己也發(fā)現(xiàn),深度學(xué)習(xí)在圖像檢索里效果很不錯,他開始在思考,這究竟是一個僅僅在圖片搜索這個垂直領(lǐng)域,還是一個趨勢。他覺得它是代表一種趨勢的,對很多其他計算機(jī)科學(xué)要解決的問題都是非常有用的,因為隨著互聯(lián)網(wǎng)這么多年發(fā)展,數(shù)據(jù)越來越多,越來越豐富,計算資源越來越便宜,越來越強(qiáng)大。他也知道,人工智能發(fā)展五十年前,一直沒有人看好,其實當(dāng)年他在美國讀書的時候,很喜歡人工智能這門課,但是教授告訴他,學(xué)這個找不到工作。不過,后來他們慢慢發(fā)現(xiàn),原來以為沒有用的東西,后來有用了。
因此,他說自己食言了。本來他認(rèn)為,作為一個商業(yè)公司,百度不應(yīng)該去做研究院,應(yīng)該去跟產(chǎn)品和應(yīng)用部門緊緊結(jié)合??墒侨斯ぶ悄懿灰粯?,它需要長遠(yuǎn)的布局,所以百度開始組建研究院,吸引和招募人才。
人工智能是模仿人腦或者仿生,還是擁有全新的思維方式?
不過說到人工智能的發(fā)展,還記得就在這場高端對話之前,馬云才提出了一個觀點,認(rèn)為不應(yīng)該講Artificial Intelligence,應(yīng)該是Machine Intelligence,現(xiàn)在的人工智能,都是在模仿人腦如何工作,但實際連人類自己,對人腦的了解和開發(fā)都不超過3%。機(jī)器應(yīng)該擁有自己的獨特的思維方式,而不是永遠(yuǎn)模仿人類怎么工作,只有這樣兩者結(jié)合起來工作,才會發(fā)揮更大的作用。
于是,主持人也觀察到,比如機(jī)翼、雷達(dá)也好,這些都是一些仿生的設(shè)計,甚至是現(xiàn)在深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)。
就此,他問了幾位IT領(lǐng)袖一個問題,他們認(rèn)為人工智能是模仿人腦或者仿生,還是要擁有全新的思維方式?
小馬哥說,我們當(dāng)然是希望有一些新的東西,但現(xiàn)階段,還是應(yīng)該務(wù)實點,現(xiàn)階段還是通過仿生的階段。在某一些垂直的領(lǐng)域嘗試,要做一個通用的AI非常難,包括圍棋也是選一個非常窄的領(lǐng)域,甚至一旦規(guī)則變了,幾乎就要重新訓(xùn)練,之前的訓(xùn)練全白費了。
李彥宏則并不同意,現(xiàn)在的深度學(xué)習(xí)是在仿生,因為“其實我們也不知道人腦是怎么工作的,怎么去模仿呢?神經(jīng)網(wǎng)絡(luò)只是為了讓大眾更明白研究人員在做什么的一個比喻。”不過,他確實認(rèn)為,深度學(xué)習(xí)只是在很初步的階段,我們要達(dá)到人腦的程度,還要很久很久。他還解釋,其實這個很久的意思,我認(rèn)為是永遠(yuǎn)不可能的,甚至像之前以為一位演講嘉賓朱民說的,將人工智能分成三個階段,弱人工智能到強(qiáng)人工智能,再到超級人工智能,第二個我都覺得不行,永遠(yuǎn)不可能。
沈向洋很贊同李彥宏的觀點,他認(rèn)為,目前腦科學(xué)的發(fā)展還很初級,限制了人工智能的發(fā)展。計算機(jī)馮·諾依曼的結(jié)構(gòu),跟人腦的結(jié)構(gòu)本來就完全不一樣。他相信,隨著人工智能發(fā)展,未來會有越來越多學(xué)計算機(jī)的人去做研究腦科學(xué)。
最后,我們都知道,人工智能之所以在今天快速發(fā)展,有三個基礎(chǔ):海量數(shù)據(jù)、強(qiáng)大運算能力和深度學(xué)習(xí)的發(fā)展。
在中國,掌握著最大數(shù)據(jù)量的,莫過于BAT了,百度做不少開放平臺。主持人突然就順勢小馬哥,你們騰訊有那么多社交數(shù)據(jù),有沒有可能把數(shù)據(jù)分享出來,讓創(chuàng)業(yè)公司用?
馬化騰依然回答得非常實在。他說,“這個問題我們在內(nèi)部也有激烈的爭論”,場景對于研究確實很重要,很多研究都需要實際運轉(zhuǎn)數(shù)據(jù)的支持,不過,不是有一堆數(shù)據(jù)就能用,數(shù)據(jù)還需要清洗和標(biāo)簽化,才能讓AI去學(xué)。這是一個非常龐大的工作量,甚至還是需要人去用很笨的方法打標(biāo)簽。運算能力對人工智能也很重要,需要用云的資源,所以騰訊也在做云。
更緊缺的,就是人才了,他說,一年前騰訊也很缺人才,如今逐漸招募了不少。為了招賢納士,騰訊還在西雅圖也設(shè)立了一個實驗室,“因為很多微軟的人都不愿意離開西雅圖,因為我們就在旁邊設(shè)了一個研究院”。
設(shè)立了研究院之后,騰訊內(nèi)部也在問各個業(yè)務(wù)線,數(shù)據(jù)能不能給研究院做研究用。但是,其實業(yè)務(wù)部門本身,也希望能招人去處理和挖掘利用自己的數(shù)據(jù),而不是全部分享給別人。因此,即便單論公司內(nèi)部,也會有這個問題。
第二個則是用戶隱私問題,因為騰訊的社交數(shù)據(jù)涉及大量用戶隱私,如何脫敏是個很關(guān)鍵的問題。要清洗到什么地步才能用,還要看看。最后他總結(jié),數(shù)據(jù)的標(biāo)簽化和清洗,業(yè)內(nèi)也有很多人也都在努力,很多公司拿著一堆裸數(shù)據(jù),也不知道怎么辦,所以我們必須先把數(shù)據(jù)整理過才能用,他說這還是一個很長的過程。
附全程對話實錄:
吳鷹:先從馬化騰開始。剛才朱民演講中特別舉了你們這個團(tuán)隊的例子,13個人真的是沒有一個人是會下圍棋的,騰訊有一個700多人、成立了大概一年多的人工智能團(tuán)隊,專門研究人工智能,他們在很短時間內(nèi)聚集了很厲害的一些專家。
能不能跟我們大家分享一下騰訊為什么在人工智能上這么重視,還有你對人工智能的看法和行業(yè)的看法?
馬化騰:其實李彥宏是人工智能走得更前了,對騰訊來說,我們還是落后不少,只是去年剛開始成立的部門。
當(dāng)然在我們所有BG內(nèi)部結(jié)合它的業(yè)務(wù)形態(tài)都有在落地,像我們微信里面,超過上百億條消息,包括我們圖片、特別是做社交網(wǎng)絡(luò),里面有人臉數(shù)據(jù)圖片絕對是天文數(shù)字,每天高達(dá)上十億張有人臉照片。
這方面的技術(shù)研究在各個BG有相當(dāng)長時間研究,包括后臺數(shù)據(jù)分析、廣告匹配都用了人工智能技術(shù),只是大家感受不到。因為他在后端。我們在前端也希望做出一些產(chǎn)品,剛好一年前Alpha Go它的paper出來,通過人機(jī)對戰(zhàn)讓全世界對人工智能認(rèn)知到了一個新的高潮,我們團(tuán)隊本著練兵的心態(tài)也做了嘗試。
谷歌收購了deepmind團(tuán)隊發(fā)表的論文,原來做計算機(jī)圍棋的團(tuán)隊都紛紛采用深度學(xué)習(xí)方法來融入原有的似乎已經(jīng)走進(jìn)瓶頸的計算機(jī)圍棋軟件開發(fā)中,大家不約而同在這一年中起步。
我們內(nèi)部團(tuán)隊有三個團(tuán)隊也在做,只是分在不同部門。這個部門剛好是它能夠突破這個瓶頸,也動用了公司相當(dāng)?shù)拇蟮暮蠖说挠嬎銠C(jī)資源,更大的特點是它和Alpha Go不同的是我們的決議AI的成長,全程得到了國家級圍棋世界冠軍從一開始的陪練,然后找出它為什么不同。我們十幾位研發(fā)人員不懂圍棋的,一開始連黑先下還是白先下的規(guī)則都不懂,我們從計算機(jī)原理、工程實現(xiàn)以及結(jié)合中國包括很多的專家來去訓(xùn)練。
我們覺得這算是小小的成功吧,但是也不能過于欣喜,畢竟是站在前人肩膀上,因為你沒有發(fā)布這個paper,我們也不可能做出來,但是也不能說這是毫無疑義的事情。
這里面給我們最大的思考是,過去我們對AI很多是從一些規(guī)則、從簡單的訓(xùn)練得出來的能夠改善我們計算處理的這樣一種能力,最終我們發(fā)現(xiàn)其實還有一個更恐怖、更深層的意義在于他能夠在計算機(jī)的后臺能夠用云計算、大數(shù)據(jù)方式能夠高速的自學(xué)習(xí),能夠自己跟自己對奕。
所以AlphaGo出來后,它的下一代master,經(jīng)歷了數(shù)十億盤自我對弈,已經(jīng)超越過去所有人類交戰(zhàn)的盤數(shù),然后它自己尋找規(guī)律,找到的已經(jīng)遠(yuǎn)遠(yuǎn)超過人類過去在圍棋領(lǐng)域認(rèn)知的范圍,是極大的擴(kuò)展,這是給我們一個很大的啟示。
在很多的領(lǐng)域——圍棋以外的領(lǐng)域,不管是醫(yī)療(剛才講的病理的檢測),以后的金融,現(xiàn)實中的每個行業(yè),如果能用計算機(jī)后臺做出一個模擬器,能夠讓它充分嘗試,就像開車一樣,你可能不用教自動駕駛怎么開車,就模擬一個現(xiàn)實環(huán)境,給它一個規(guī)則,讓它駕駛,它去撞,有各種反饋,自然會琢磨出一套理論和經(jīng)驗,這是給我們帶來巨大思考。在很多領(lǐng)域如果能做出模擬器,定義出很多參數(shù),自己學(xué)習(xí),他能找到規(guī)律可能遠(yuǎn)超我們現(xiàn)在想象的。這是我們最大的啟示。
吳鷹:謝謝Pony。沈向洋先生作為微軟人工智能事業(yè)部的負(fù)責(zé)人,你講講為什么人工智能這幾年能有突破性發(fā)展,能不能預(yù)測一下最可能在哪些領(lǐng)域具有顛覆性的應(yīng)用出現(xiàn)?
沈向洋:謝謝吳鷹。我每次聽完馬云講話以后都沒有話可以講,馬云基本上把大家想講的都已經(jīng)講完了。
我從研究生開始學(xué)習(xí)人工智能,也有20、30年時間了?,F(xiàn)在看到人工智能如火如荼,非常激動。因為我們90年代中畢業(yè)的時候出來的時候工作都找不到,現(xiàn)在大家恨不得見到一個懂人工智能都投錢。
人工智能經(jīng)歷了多少個冬天,之所以今天有這樣的發(fā)展機(jī)會,主要還是因為三個方面原因,第一件事情,是因為互聯(lián)網(wǎng)的出現(xiàn),互聯(lián)網(wǎng)+物聯(lián)網(wǎng)提供了更多的數(shù)據(jù)。第二件事,強(qiáng)大的運算能力。摩爾定律到現(xiàn)在,大家覺得應(yīng)該會死掉,但是還沒有死掉,還有更多新的計算方法。第三,過去五六年深度學(xué)習(xí)突然突破,包括騰訊研發(fā)領(lǐng)域充分運用到深度學(xué)習(xí),令到大家突然看到很多不能解的問題現(xiàn)在可以解掉。
從人工智能基本和研究方向來講,還是兩個不同非常不一樣的階段。一個是人類感知這件事情上,我們講人工智能,原來對人工智能的定義就是跟人類智能相比較。人類的智能體現(xiàn)在哪?主要是兩方面,一個是感知方面、一個是認(rèn)知方面。感知方面,剛才我提到這幾個原因,所以在接下來5-10年進(jìn)展會非??臁>唧w表現(xiàn)在計算機(jī)語音和計算機(jī)視覺發(fā)展,我覺得AI會超過人。很多人會同意我這個說法。第二方面問題大家今天還沒有搞的很清楚的地方是人工智能的認(rèn)知方面,包括自然語言,包括知識的獲取、包括你對一般的情況下這種解決的方法這樣的思考,包括情感,這些東西今天我們還都是不知道。
您剛才提到現(xiàn)在人工智能給大家創(chuàng)造了一些什么樣的機(jī)會,從微軟公司來講,我們的研判覺得短期之內(nèi)是有非常非常大的商機(jī),你看到底有那些行業(yè)已經(jīng)相對而言有相當(dāng)大量的數(shù)據(jù),而且同時在這個行業(yè)里面從事人員是不高興的,那你就有商機(jī)了。
如果這樣看的話,到今天來講,幾乎所有的商業(yè)應(yīng)用,從市場銷售到HR部門招聘,到客戶支持這方面,所有的都會被顛覆掉。我是覺得客服是接下來五年最多的AI應(yīng)用的商機(jī),我這樣講并不是說自動駕車不重要、圍棋下棋不應(yīng)該做研究。只是具體回答吳鷹的問題,從我們來講最大的商機(jī)在哪,就是每一個商業(yè)應(yīng)用都會被顛覆掉。
吳鷹:大家注意沈博士說每一個商業(yè)應(yīng)用都會被顛覆掉。這是非常震撼的一個結(jié)論。
郭為先生,你是神州數(shù)碼的掌舵人,你們在智慧城市方面有很大的布局,很多人會認(rèn)為你們好像跟人工智能不一定有那么大的關(guān)系。請你談?wù)勀銓θ斯ぶ悄艿目捶ā?/p>
郭為:謝謝吳鷹。剛才沈向洋講到今天人工智能有一個比較大的突破,實際上就是三點:一個是由于互聯(lián)網(wǎng)出現(xiàn),大數(shù)據(jù)出現(xiàn)。第二,計算能力高速度。第三,算法。
我們做智慧城市過程中,我們?yōu)槠髽I(yè)定位過程中也考慮到,計算能力這個事兒我們做不了。第二,算法上。昨天研討會上,還有今天,大家認(rèn)為中國目前還是落后、還是在學(xué)習(xí)階段。作為一個傳統(tǒng)企業(yè)轉(zhuǎn)型的話,唯一能做的就是數(shù)據(jù),就是如何能夠采集到更多數(shù)據(jù)。
由于我們以前的積累,我們在很多行業(yè)有很多應(yīng)用,使得我們能夠接觸大量的數(shù)據(jù),這些數(shù)據(jù)如何從傳統(tǒng)的方式上轉(zhuǎn)移到用互聯(lián)網(wǎng)方式,或者今天我們定義用深網(wǎng)數(shù)據(jù)挖掘,如何在三網(wǎng)環(huán)境下采集數(shù)據(jù)就變成我們的核心競爭力。所以做智慧城市過程中我們是不斷探索這樣的工作,慶幸的是由于我們跟北大合作,使得我們在深網(wǎng)挖掘上有很大的變化,我們發(fā)明了相關(guān)技術(shù),使得快速生成API,為智慧城市打造了一個基于大數(shù)據(jù)操作系統(tǒng),如何能夠快速形成一個城市數(shù)據(jù),然后進(jìn)行分析、應(yīng)用,這就是做智慧城市的實踐,正是因為這樣一個實踐,我們花了6、7年時間,某種程度上也是碰得頭破血流。
我也很同意馬云的觀點,我們既不能把人工智能太深化,但是也要看到他確實還是能夠幫助我們做成一些事情。比如在一些特定領(lǐng)域里,在醫(yī)療看片子、制定醫(yī)療方案可以做的很好。比如在農(nóng)業(yè),由于土地確權(quán),我們掌握了20億畝土地的信息,土地上有什么數(shù)據(jù),我們幫助進(jìn)行分析,提升我們農(nóng)業(yè)收入,包括進(jìn)入扶貧領(lǐng)域。這些應(yīng)用是做智慧城市過程中一個非常好的方面。
總的來講,既要發(fā)揮神州數(shù)碼在傳統(tǒng)IT領(lǐng)域的應(yīng)用上的特征,另外就是擁抱互聯(lián)網(wǎng),擁抱大數(shù)據(jù),如何在這個領(lǐng)域里面有一些技術(shù)性的突破,使得我們自己的企業(yè)能夠在這個領(lǐng)域做一些事情,這就是我們今天做智慧城市要做的工作。
吳鷹:百度在人工智能布局很早,而且深度學(xué)習(xí)上比美國很多大公司還要領(lǐng)先,這種評價并不過分,而且你在兩年前全國政協(xié)大會上提出中國大腦這個建議。對中國也是非常重要。從百度角度你能不能談?wù)勱P(guān)于人工智能發(fā)展你們的看法。當(dāng)年你們?yōu)槭裁茨敲丛缱鲞@些布局?
李彥宏:我其實也思考過這個問題。從百度的基因來說,我們從一開始成立到現(xiàn)在最主要是做搜索。搜索本質(zhì)上是機(jī)器試圖理解人想要的東西。
我們一開始用各種各樣計算機(jī)方法試圖理解人的意圖,我在想一個問題,深度學(xué)習(xí)在圖像檢索里頭的效果不錯,是一個偶然還是它代表一種趨勢。分析完之后,覺得它是代表一種趨勢的,它不僅僅對于圖像搜索有用,它對很多其他計算機(jī)科學(xué)要解決的問題都是非常有用的。原因就是,隨著互聯(lián)網(wǎng)這么多年發(fā)展,數(shù)據(jù)越來越多,越來越豐富,計算資源越來越便宜,越來越強(qiáng)大。
所以人工智能剛才說有60年歷史,前50年,為什么大家不看好,為什么大家覺得人工智能沒有用,我在美國讀書的時候,我就很喜歡人工智能這門課,但是學(xué)完之后,教授告訴我說其實沒用,人工智能沒有一個真正有商業(yè)價值的應(yīng)用,你將來靠這個是找不著工作的。
到現(xiàn)在最近幾年,原來認(rèn)為沒用東西變成有用,是因為市場環(huán)境變了,條件變了,原來認(rèn)為不可能的事情現(xiàn)在變成可能了。分析了環(huán)境因素之后,覺得人工智能是代表未來的。所以我們在2013年1月份對外宣布成立深度學(xué)習(xí)研究院,這個可能是全球工業(yè)界第一個用深度學(xué)習(xí)來命名的這么一個研究院。
而且這等于我自己食言了,我2013年以前不斷跟外界說我們是一個商業(yè)公司,我們不應(yīng)該成立研究院,不應(yīng)該搞純的研究機(jī)構(gòu),這些機(jī)構(gòu)要想轉(zhuǎn)化成產(chǎn)品,進(jìn)入市場被市場所認(rèn)可的話,應(yīng)該跟那些產(chǎn)品部門、跟那些業(yè)務(wù)部門緊緊結(jié)合在一起,而不是單獨成立一個研究院,但是深度學(xué)習(xí)這一波起來之后,我覺得是完全不一樣的東西,他需要在理論上、在算法上,在很多方面有長遠(yuǎn)的布局和突破,所以從那個時候開始大規(guī)模投入去吸引人才,去推進(jìn)算法,其實不光是算法,在剛才朱民講的時候也講到各種各樣芯片結(jié)構(gòu)層、CPU到GPU等等,都要審視算法的需求。
所以現(xiàn)在看起來人工智能比2013年我們決定進(jìn)入的時候一個更要大的產(chǎn)業(yè)。前一陣我對外講了,互聯(lián)網(wǎng)其實現(xiàn)在只是一道開胃菜,真正的主菜是人工智能,所以人工智能不是互聯(lián)網(wǎng)的一部分,不是互聯(lián)網(wǎng)第三個階段,它是堪比工業(yè)革命一個新的技術(shù)革命。
吳鷹:開胃菜已經(jīng)更大了,互聯(lián)網(wǎng)是人工智能的開胃菜,媒體可能會引用這個論斷,但是主菜得多大的市場。我覺得你跟沈向洋說的顛覆所有的商業(yè)模式,這個影響是非常大的。沈向洋,微軟人工智能事業(yè)部有多少人?
沈向洋:一共有7000多個工程師和科學(xué)家,我們還在繼續(xù)招人,并且Pony和Robin經(jīng)常來挖我們的人,Jack也挖。
吳鷹:沈博士就直接進(jìn)入火藥味比較濃的階段的,微軟如果進(jìn)入中國,已經(jīng)進(jìn)入了,人工智能市場的話,BAT,你最想干掉馬云、馬化騰還是李彥宏?
沈向洋:借助剛才馬云講的,彎道超車十超九翻,要換道超車才有希望,在任何競爭的過程中總是要找到自己的出發(fā)點。
既然你給我這樣一個機(jī)會的話,我就提一下,微軟在中國最近這幾年推出的最了不起的人工智能叫微軟小冰,我不知道在座的有沒有用微軟小冰,可能在座的不是我們面對的用戶群,我這樣講你不要生氣,我們的用戶群是18-24歲相對的年輕用戶群,大家有時間和智能聊天機(jī)器人,這也是為什么我們選擇跟Pony這邊的QQ合作,也是針對這樣相對年輕的用戶群。
之所以我提這樣的人工智能產(chǎn)品和一般的智能助理還不太一樣。人類進(jìn)化多少萬年下來以后,每天講很多的話,你可能不知道,其實男人在一天大概講幾千句話,女士一天可能講超過一萬句話。大多數(shù)的話并不是說講一句話一定要完成一件什么工作,我老師講大多數(shù)人一天講的話很多都是廢話,但是這個講話很重要,講話是人工智能里面最重要的一件事情,在很大程度上你的EQ是體現(xiàn)在你怎么去講這個話。我們推小冰的過程中學(xué)到了很多東西,我們現(xiàn)在主推的方向,研究和產(chǎn)品的方向就是所謂的對話式人工智能。
吳鷹:我沒用過小冰,但你好像還是沒有直接回答我的問題,你最想先干掉誰?
沈向洋:你剛才問了什么問題?
吳鷹:高手。
我也想借馬云剛才講的問一個仿生問題,飛機(jī)剛出來之前,大家想的思路是看鳥在空中飛很羨慕,剛開始做飛機(jī)就想做一個像鳥一樣的。
我就想問臺上的四位嘉賓,不用專業(yè)知識,就是直覺,在人工智能上有突破的事,模仿人腦的,你們覺得仿人腦的方式會有所突破,還是完全不一樣的想法?
郭為你就先說,說錯了也不要盡管,反正你也不是人工智能專家。
郭為:是功能性的突破,還是仿生的東西,就拿AlphaGo來講它下一盤圍棋所消耗的能量,有人告訴我需要2噸煤,但是一個圍棋手可能就是兩碗米飯。
我們在考慮一個功能的時候,需要考慮多大的資源消耗,這對于人類進(jìn)步是很重要的。你可以實現(xiàn)這個功能,實驗室可以做得出來,但是無法實現(xiàn)工業(yè)化,就是要考慮成本,考慮到資源的消耗。
人工智能之所以用功能性替代就是考慮這些因素,就是完全模仿本身也非常困難。我也非常同意馬云的說法,人的大腦功能,我們自己認(rèn)知只有3%,最終就是用功能,而功能的替代能量消耗要比人本身,人還是太神奇了,這個我覺得很難達(dá)到人的程度。
我最近看一本書《人的宗教》,就講人是由三個東西構(gòu)成,一個是你的生命,一個是你的心智,第三個是你的心靈或精神。我們反過來講精神的東西,我無法想象機(jī)器能夠代替精神的東西,最多也就是體力上能夠替代,智慧上不能,在某些方面的替代,完全替代人不可能,某些替代就是功能上的替代,所以突破就在功能上的替代,然后提高一定的效率,這是我對人工智能的看法。
所以我為什么同意馬云的觀點,實際上機(jī)器怎么樣能夠做得更好。我看遠(yuǎn)古的博物館,人類發(fā)明一個針,這和今天人工智能的發(fā)明對人的沖擊是一樣的,當(dāng)時人縫不了衣服,沒有針怎么縫衣服,發(fā)明針是多么神奇的事,能夠把衣服縫起來,今天做人工智能也和當(dāng)年發(fā)明針沒有根本的區(qū)別,人在進(jìn)步的過程中不斷發(fā)明新的工具,而新的工具最終還是為人類服務(wù)的。
吳鷹:Pony覺得是用模仿人的方式,還是全新的?
馬化騰:我們當(dāng)然期待有一個本質(zhì)的,發(fā)現(xiàn)飛機(jī)的螺旋槳也好,還是流體動力學(xué),還是鳥的翼,或者是馬跑,現(xiàn)階段還是通過仿生的階段,在某一些垂直的領(lǐng)域,你現(xiàn)在要做到一個通用的AI非常難,包括圍棋也是選一個非常窄的領(lǐng)域,然后給它學(xué)習(xí),通過各種參數(shù)來訓(xùn)練。
剛才郭為提到的用AlphaGo下一盤棋要消耗多少能源。這個垂直領(lǐng)域訓(xùn)練數(shù)據(jù)是需要消耗很大的能量,但在實際用的時候其實不需要消耗太大的能量。我們絕藝訓(xùn)練出來的單機(jī)成本跟職業(yè)棋手差不多,但是要訓(xùn)練出這個模型來要很長時間,稍微改一改規(guī)則就全部要進(jìn)行重復(fù)訓(xùn)練,改進(jìn)一點之前的積累都不算,要從頭積累一遍,消耗的能量很大,而且時間很長,這是很窄的一個技能模擬。
下一步到通用的,再下一步是不是有更本質(zhì)性的,發(fā)現(xiàn)它背后的原理,智能可以超越人的碳基的智慧,是不是有其他更多的基礎(chǔ)元素可以形成更高級的生命智慧呢?這可能是超越人類現(xiàn)在所發(fā)現(xiàn)的知識,這也是有可能的。甚至有人還突發(fā)奇想說我們現(xiàn)在認(rèn)識的宇宙就是高智能的生命,用他的量子計算機(jī)模擬出來的環(huán)境,我們一切都是模擬出來的,也有可能。大家發(fā)揮腦洞大開的想象力吧。
吳鷹:腦洞大開,一切皆有可能,Robin怎么看?
李彥宏:其實我不太認(rèn)可人工智能現(xiàn)在做的是仿生學(xué),現(xiàn)在我們講人工智能像是人腦神經(jīng)元的工作原理,但是人腦具體怎么工作的,剛才馬云講的我們只了解3%,我們并不知道人腦是怎么工作的,你不知道它怎么工作怎么仿它?我們只知道這一點點,這一點點計算機(jī)的算法有一點類似之處。
我同意現(xiàn)在的人工智能,尤其是機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的算法還確實處在非常初級的階段,還有很多提升的空間,現(xiàn)在做得還非常不夠。什么時候能夠挑戰(zhàn)真正人的認(rèn)知能力,我覺得還有很長很長的時間。
我說話比較保守,我說很長是說這一天永遠(yuǎn)不可能來到。第一階段是弱人工智能,第二階段是強(qiáng)人工智能,第三階段是超人工智能,我認(rèn)為到強(qiáng)人工智能這個階段就達(dá)到不了,不僅僅是你永遠(yuǎn)搞不清楚人腦是怎么工作的,你即使用電腦的方法模擬人腦,要想完全達(dá)到人腦的水平,我覺得也做不到,永遠(yuǎn)做不到這件事情。
吳鷹:我們IT領(lǐng)袖峰會就是觀點。我也不用問沈向洋了,因為確實是人腦到底怎么工作的,不知道。但是這個答案非常簡單,因為有一個上帝。所以很多科學(xué)家到最后就信上帝了,變成找到一個答案了。沈向洋,你還有補(bǔ)充?
沈向洋:我蠻贊成李彥宏剛才講的,人工智能這件事情發(fā)展,今天最大問題是對人腦不了解。
腦科學(xué)今天還是非常初步的科學(xué),你每次要講科學(xué)的話,首先要一定要有數(shù)據(jù),要能夠做試驗,而且做重復(fù)的試驗,今天就沒有辦法真正監(jiān)測到真正做試驗說因為加入了這樣的輸入到人腦,出現(xiàn)什么樣的輸出。
接下來N年應(yīng)該有更多的人投身基礎(chǔ)科學(xué)研究腦科學(xué)這件事情??唇裉煊嬎銠C(jī)體系結(jié)構(gòu),馮諾伊曼結(jié)構(gòu),跟人腦結(jié)構(gòu)完全是兩碼事??赡芤蚕駨埥淌谡f飛機(jī)的模仿并不是真正像鳥一樣,我覺得肯定是這樣的情況。
接下來很多方面肯定叫弱人工智能也好,這些很多的人的智能方面我們能夠想象得出來,今天人能夠做的事情在不遠(yuǎn)將來,絕大多數(shù)事情,人工智能都可以達(dá)到。
我舉一個小的例子,比如今天大家講你今天可以做視覺識別了,物體識別了,你今天可以做語音識別了,那今天人還有什么事情很了不起,大家覺得通過學(xué)習(xí)的方法,我們可以達(dá)到一個什么樣的高度。很重要一件事情是機(jī)器閱讀,閱讀的能力。我要考高考、考SAT,閱讀一篇文章后,你問一個問題,我可以答一個問題。
像這樣的問題接下來5-10年可能是人工智能很大突破的地方,一旦有突破后,搜索也好、社交網(wǎng)絡(luò)也好、其他商業(yè)應(yīng)用也好,有很多這樣的機(jī)會。
今天大家覺得激動人心的地方是因為以前是完全符號式、公式去做,今天是神經(jīng)網(wǎng)這樣一種解法。它的區(qū)別在于以前符號式做法,你覺得用符號式做法解了一個問題,是可以解釋的,而今天這種神經(jīng)網(wǎng)解法,包括Pony做的圍棋機(jī)器人,他很難去解釋為什么下這一步。
所以,接下來有一個需要研究的問題,從符號式到神經(jīng)式怎么樣回過頭再到符號式,就是研究行業(yè)很熱門的方向,叫做可以解釋的人工智能。
吳鷹:咱們講了這么多人工智能的話題,講一點跟在座嘉賓更接近一點的,我本來想問李彥宏怕不怕微軟,想不想把它干掉,但是沒有什么意義,他們都有很智慧的回答,肯定會回避開。
但是我注意到百度你們的深度學(xué)習(xí)有一個開放平臺,咱們小公司在這方面沒有投入,沒有技術(shù)積累,想要用也是可以用,是免費開源平臺。這個是挺有意義。
你們當(dāng)年決定這么做的時候,你們不覺得這樣開放后會培養(yǎng)你的競爭對手嗎?
李彥宏:我覺得人工智能是一個非常大的產(chǎn)業(yè),而且是會持續(xù)很長時間。像我們現(xiàn)在的判斷未來20-50年都會是一個快速發(fā)展的人工智能時期。
在這種時代大潮下,顯然不是一個公司能夠把所有的事情都做下來的。相反的,如果說我們先進(jìn)入了這個領(lǐng)域,能夠提供一些平臺給一些尤其是沒有這么多計算資源、沒有這么多做長遠(yuǎn)研發(fā)能力的機(jī)構(gòu)去做他們擅長的,他們對于很多垂直領(lǐng)域可能比我們的了解就會更加深刻,讓他們?nèi)プ龅脑?,他會推動整個人工智能技術(shù)的發(fā)展。
所以從這個意義上講,我們把我們的平臺開放出來,對大家有益,對我們也有益,我們可以在平臺上看到大家在干什么事情,哪些方向發(fā)展會更快一些,哪些領(lǐng)域更適用于現(xiàn)在已經(jīng)解決的技術(shù)。我剛才講人工智能永遠(yuǎn)不可能超過人類的能力,但是當(dāng)他逐步逼近人類能力的時候,其實已經(jīng)是可以一個一個行業(yè)去顛覆掉。
比如說人臉識別這種應(yīng)用,我們今天如果你去機(jī)場的話,要過好幾道安檢,又要把身份證拿出來,比對一下,其實人臉識別這個問題解決后,將來到機(jī)場就應(yīng)該大搖大擺就過去了,他那個攝像頭可以識別,不需要一道一道檢查的。我們在家里自己開一個Party,不可能每個人進(jìn)來先把身份證看一看。但是人多了,幾千人、幾萬人,甚至更多人的情況就要用現(xiàn)在比較笨的辦法一個人一個人對他的身份。
現(xiàn)在這個問題基本上解決了。比如百度大廈,我們那個閘機(jī)就是刷臉可以進(jìn),到哪兒直接過就可以了。這還是人臉識別一個東西。語音的識別、自然語言的理解等等,都是可以。
未來人和物的交流方式,人和工具交流方式,不是人學(xué)習(xí)工具怎么使用。人和動物的區(qū)別就是人發(fā)明了工具,但是人發(fā)明了工具之后,是發(fā)明人寫一個用戶手冊告訴你這個東西怎么用,電視怎么用、冰箱怎么用,這些東西,電腦手機(jī)怎么用,我們要學(xué)習(xí)用鍵盤,小時候都要學(xué)打字。
未來應(yīng)該是機(jī)器、工具學(xué)習(xí)人的意圖,以后人再也不需要學(xué)習(xí)工具怎么用了,我要這個工具干什么,他就能夠明白,這就是我希望用人工智能方法解決理解人的自然語言,以后人和機(jī)的對話、人和物的對話就變成一種自然語言的對話,這是未來幾十年可能代表人工智能發(fā)展最大的方向。
吳鷹:確實這樣的話,從剛會說話的小孩兒1歲多到很老的老人都可以簡單使用計算機(jī)了,這個確實沒有什么太難的。像我母親,她就是老學(xué)不會手機(jī)怎么用。我就想給她用iPad,最近要給拿弄一個。
我想問一問馬化騰,微信,再加上QQ,這是世界最大的社交網(wǎng)絡(luò),里頭有大量的數(shù)據(jù)。剛才前面發(fā)言人都重復(fù)講了,大數(shù)據(jù)是人工智能非常重要的方面。從中國來講,在算法上現(xiàn)在還落后于美國,剛才李彥宏也講了完全超過人類是不可能的。
大數(shù)據(jù)這么重要的話,微信在很多方面已經(jīng)超過社交了,現(xiàn)在是生活很重要的一部分,剛才說你去公園買一個2塊錢小孩玩具,微信支付都可以做。
你們有沒有可能把數(shù)據(jù)分享出來,讓創(chuàng)業(yè)公司大家來用?
馬化騰:這個問題在內(nèi)部我們也有激烈討論。
首先看人工智能我們關(guān)注那幾塊,第一個是場景。場景就是你想把這個技術(shù)應(yīng)用在什么場景下,你是不是有高頻的跟用戶接觸,這是一個落地的很重要的地方。所以我們看到很多研究院也好,包括我們內(nèi)部研發(fā)團(tuán)隊。如果沒有場景落地,沒有平臺支持,基本上就是空中樓閣,研究一半很難往下走。
第二個是大數(shù)據(jù)。大數(shù)據(jù)也是從平臺、業(yè)務(wù)部門有大量實際運轉(zhuǎn)數(shù)據(jù)才能產(chǎn)生出來。但是這里面很多大數(shù)據(jù)是垃圾數(shù)據(jù),因為沒有標(biāo)簽,每人做規(guī)劃定義,用多好的算法也學(xué)不出來,學(xué)出來也是走火入魔,沒有用的。數(shù)據(jù)清洗、標(biāo)簽化難度非常高,我們甚至要雇傭很多人用人手的辦法,先用人腦清洗干凈,再讓AI學(xué)習(xí)。這里面是一個混合結(jié)合的過程。
第三,計算能力。也就是你有云的資源,拿幾十萬核的計算能力,CPU、GPU,我們還是有這個能力的。而且在云里面本身就可以很好的調(diào)用,這是我們第三個優(yōu)勢。
第四個,一年前我們比較缺乏的就是人才。通過一年我們也招了挺多的人,我們在微軟、在西雅圖還設(shè)置了一個實驗室。因為很多微軟的人不愿意離開西雅圖,所以我們就在旁邊設(shè),沒有辦法,人才就是這樣。幾個方面結(jié)合起來才有辦法真正在某一個領(lǐng)域看到它的成效。
我們現(xiàn)在觀察到很多的AI所謂的大拿們,他們更關(guān)注怎么落地,能不能把畢生研究成果能夠體現(xiàn)出來,所以在我們內(nèi)部在吸引人才的時候,往往也會說你們微信、手機(jī)QQ里面的平臺數(shù)據(jù)能不能給他們用。
但是事實上大家都知道,BG、部門里面的平臺他們也很希望近水樓臺先得月,數(shù)據(jù)就在我身邊流動,我為什么不能招人先研究一把,為什么給你呢?我們現(xiàn)在還處在內(nèi)部怎么把數(shù)據(jù)分享出來這個階段。
當(dāng)然這里面還有一個用戶很關(guān)注的個人隱私:別把我的數(shù)據(jù)都賣了,到時候大家都知道。這里面還有一個很復(fù)雜的信息安全個人隱私脫敏,你是不知道無法根據(jù)數(shù)據(jù)倒推到哪一個人做了什么事情,我們要把這些處理干凈才能往下一步談。
這里面數(shù)據(jù)清理到什么標(biāo)簽,才能給其他部門、包括外部合作伙伴怎么用。同時有很多數(shù)據(jù)來自合作伙伴,業(yè)界其他公司,他們也遇到這樣的問題那者一堆裸數(shù)據(jù)不怎么用,這樣業(yè)界還要有一個標(biāo)準(zhǔn),互惠互利交換,這是一個大方向,還有很長的路要走。
吳鷹:大數(shù)據(jù)清理之后,有針對性的,對業(yè)界別人是一個價值,別人也是一個補(bǔ)充。我相信人工智能是一個全社會的協(xié)調(diào)最后發(fā)展的過程。剛才朱民講有那么多問題,所以政府也要介入來做。
其實還不光是中國,是一個世界范圍內(nèi)大家協(xié)同做一些事情。微軟如果大家愿意跟你們合作,你們是不是感興趣這個事情?
沈向洋:你剛才問Pony這個問題問的非常好,作為大公司來講,特別是成功大公司來講,我們對社會有一個責(zé)任,對行業(yè)有一個責(zé)任。當(dāng)我們行業(yè)做的很成功,第一件事情就是開研究院?,F(xiàn)在Pony也開研究院,唯一做的不對的就是開到微軟門口去了。
我也想分享一下在微軟的工作經(jīng)驗,你說叫這些公司把數(shù)據(jù)拿出來,讓初創(chuàng)公司或者其他公司去用,我覺得不見得很現(xiàn)實、不見得很容易,Pony剛才解釋的很好。但是我想鼓勵大家,很多的數(shù)據(jù)如果我們愿意花時間、花精力做一點處理,就像Pony剛才講的,然后讓研究人員去用,完全是可以做到的。
我們微軟出了兩個數(shù)據(jù)集,一個是計算機(jī)視覺標(biāo)準(zhǔn)方面的集,這樣可以做數(shù)據(jù)分割、物體分割。最近做了另外一個數(shù)據(jù)集是在自然語言,希望有一批新的做問題問答。這樣推動研究領(lǐng)域,大家在標(biāo)準(zhǔn)集下,不斷把標(biāo)準(zhǔn)集數(shù)據(jù)越做越多。我們做的方法是用搜索引擎數(shù)據(jù),非常小心處理過,包括很多隱私的問題等等。拿出一些數(shù)據(jù)讓大家做研究是非常實際的,完全可以做到。
吳鷹:Pony大家很支持你的觀點,將來我們也期待像BAT這樣的大公司,不但是說數(shù)據(jù)拿出來分享,剛才Pony還主動提到包括運算能力分享都有可能來做,這樣對創(chuàng)業(yè)公司、中小公司,包括政府、研究機(jī)構(gòu)特別是大學(xué),非常重要。
其實利潤這個事兒對企業(yè)在某些方面是制約企業(yè)發(fā)展的,他一定要完成這個利潤,他是一個上市公司要做到這些。這就相對的眼光短一點。
但是你轉(zhuǎn)型在智慧城市上鍥而不舍做了6-7年的積累,我剛開始一直打擊他,你跟政府做很多事賺不到錢,你跟政府收多收少都不合適,你們跟人工智能有關(guān)的發(fā)展上有沒有一個規(guī)劃,還是希望跟這些公司合作在人工智能方面的發(fā)展?
郭為:今年發(fā)生了一個比較大的并購案,就是因特爾收購了 Mobileye,Mobileye是以色列的一家公司,做汽車駕駛輔助的,Mobileye在1000萬輛傳統(tǒng)的汽車上裝載了數(shù)據(jù)采集的東西,每天收集的數(shù)據(jù)量差不多相當(dāng)于現(xiàn)在3000億個個人生成的數(shù)據(jù)量,由于有這些數(shù)據(jù)將會支撐因特爾未來在超算上,在大數(shù)據(jù)領(lǐng)域的發(fā)展。
神州數(shù)碼整個大的體系就是想利用我們在傳統(tǒng)行業(yè)的優(yōu)勢去挖掘,剛才講深網(wǎng)數(shù)據(jù),少春是再ERP的公司,ERP的數(shù)據(jù)是不可以在互聯(lián)網(wǎng)上直接進(jìn)行傳輸?shù)?,它是深度?yīng)用的數(shù)據(jù)。
今天BAT很大的優(yōu)勢就是在互聯(lián)網(wǎng)上已經(jīng)完全壟斷了數(shù)據(jù)。客觀講只要他們不犯錯誤的話,別人是沒有機(jī)會的。當(dāng)然企業(yè)犯錯誤是必然的,只是說在哪些方面不犯錯誤,對未來的看法一旦哪個地方出現(xiàn)空位的時候,其他新的公司就出來了,比如Mobileye十幾年在數(shù)據(jù)上的積累,一下子就被大家認(rèn)可了他在輔助駕駛上的能力。
我們在農(nóng)業(yè)、醫(yī)療、制造業(yè),我們給工商總局做廣告登記的服務(wù),那也就是全中國所有的商標(biāo)注冊登記,我們掌握了全中國所有的商標(biāo)注冊的公司,你的企業(yè)究竟哪個商標(biāo)用得最多,哪個商標(biāo)價值最大,我們完全可以通過數(shù)據(jù)分析的辦法來做,這里面蘊藏了大量的商業(yè)價值。
這些東西怎么做?我覺得就是要和現(xiàn)在成功的,或者說在人工智能上走在前面的公司去做,發(fā)揮我們的優(yōu)勢深網(wǎng)數(shù)據(jù)挖掘,然后脫敏,打上標(biāo)簽,然后和別人合作把這個東西做好。這個就是我們要做的。今天我去跟BAT在互聯(lián)網(wǎng)競爭,那我是找死,那是完全不可能的事情,那真是活膩了。
李彥宏:合作的空間是巨大的。
郭為:但是數(shù)據(jù)是可以一起合作的。
沈向洋:還是跟微軟合作比較好。
吳鷹:好,有點味道了,李彥宏和Harry都在向你遞橄欖枝,你要聽話聽音,你做苦逼活那么多年了,很多數(shù)據(jù)在后面做了很多苦活。今天在臺上的嘉賓,雖然Harry一直沒有回答我的問題最想干掉誰,但還是非常精彩的答案,我們開了一個非常好的頭。