亚洲熟妇av一区二区三区,亚洲av中文无码乱人伦在线视色,亚洲人成网站色www,亚洲欧美日韩国产综合在线一区 ,亚洲av之男人的天堂网站

分享
Scan me 分享到微信

李德毅院士:智駕中圖靈困境,顛覆你所認知的智能

我們試圖創(chuàng)造人工智能,但我們連智能應是什么都不知道。

  【泰伯網(wǎng)】(記者 劉小賢)早在1950年,計算機之父阿蘭·圖靈提出圖靈測試的概念:一個人和一臺機器在被隔開的情況下,人向機器進行交流或提問。如果有30%的測試者不能確定他是在與人還是機器進行交流,那么說明這臺機器通過了測試。他也大膽預測,在2000年的時候就會有機器人通過圖靈測試。

  圖靈測試也試圖解決一個困局:我們試圖創(chuàng)造人工智能,但我們連智能應是什么都不知道。

  在無人駕駛?cè)缁鹑巛钡慕裉?,無人駕駛車輛也勢必面臨著類似的“駕駛圖靈測試”,正所謂——是騾子是馬,拉出來溜溜。但是在此之前,我們必須搞懂,對于無人駕駛車輛而言,“智能”二字究竟意味著什么。

  李德毅院士在5月21日中的演講中表示,現(xiàn)在的“智能”更多的是針對感知的研究,而非針對“認知”的研究。無人駕駛也是這樣,當自動化到了天花板,人工智能的“認知”就來了。

  認知就要有記憶。記憶是腦認知的核心,一個成年人和一個小孩子開車,遇到障礙物的認知是不相同的。而成年人的認知,更多程度地基于記憶。相對應的,遺忘也是人類智能的顯著表現(xiàn),從記憶中刪去無用的部分,即是為了更好地保存有用部分,也是對人腦的自我保護。研究認知,就要研究記憶和遺忘。認知還要有交互。熟練的駕駛員不依賴GPS就可以完成對自己的定位,這個過程就是駕駛員與世界的交互。而計算機也要完成對“上帝坐標”的交互,也要熟悉身邊的環(huán)境。

  擁有感知的無人駕駛車輛,不僅可以在道路上暢行無阻,還擁有駕駛個性,擁有駕駛記憶。會考慮如何駕駛能讓讓乘客免受顛簸,更加舒適,會選擇哪條高速更加省油。

  從感知到認知,從自動化到人工智能。智能駕駛先行一步,我們正在創(chuàng)造未來世界的“機器駕駛員”。而當機器導游、機器教師、機器醫(yī)生……紛紛出現(xiàn)的時候,等待我們的是一個強人工智能時代。

  到那時,也許人類集全部的智慧可以完成那個在計算機還像鐵箱子的年代中,圖靈提出的測試標準。而前路呢?

  李德毅自信地說:那是一個后圖靈時代。也是一個人機共生,共融,共發(fā)展的時代。

  以下是演講實錄:(未經(jīng)本人核實)

  李德毅:各位下午好,今天談一談智能駕駛,我講一下智能車做好了怎么測,怎么使得它具有拿到駕照的水平,我報告的題目是無人駕駛的圖靈測試。

  一、圖靈測試在人工智能時代再次被提上話題

  腦科學、認知心理學、神經(jīng)生物學形成了腦認知。而腦認知啟發(fā)的人工智能是目前研究的對象。圖靈測試就是用于對于這類人工智能的測試上。

  做什么東西,得把評測搞清楚。怎么測,我們一直講智能代理。智能代理或者認知它的方法是什么。圖靈先生在他年輕的時候就在想這個事情,他提出了圖靈測試,幾十年過去了,人們已經(jīng)把圖靈測試研究透了,有人說圖靈測試漏洞太多了,不好測。有人認為圖靈測試做了很大的貢獻,直到今天,人工智能經(jīng)過兩個寒冬以后,我們看人工智能帶來的變化。首先是腦科學,然后是認知心理學,接著是神經(jīng)生物學。這三個學科對于人智能的啟發(fā)更大一點,我們把這一塊叫腦認知。腦認知啟發(fā)的人工智能就是目前研究的對象,這一塊按照圖靈的說法,要拿對話來測試:用一個人和一個機器人在彼此隔絕的環(huán)境下對話,看看人類能否能區(qū)分它是人的聲音還是機器的聲音。聽起來很簡單,但是其中有多少“智能”呢?比如你回答問題的時候是否得體,交談的時候帶不帶情感,你是沮喪的溝通,還是愉悅的溝通?所以這件事情并不那么簡單。

  1950年阿蘭圖靈發(fā)布了一篇論文,其中可以看出,圖靈測試的本質(zhì)就是交互智能的測試。一直到2014年,聊天機器人尤金古斯特曼發(fā)布了。類似的交互測試有很多,比如做詩:給你一個上下聯(lián)對橫批,分別不出來是人做的還是機器人做的,是不是可以說這是圖靈測試。還有比如一百萬人同時寫一篇文章,由機器人閱卷評分,這時跟人的閱卷有什么差別?怎樣實時地交互來批改這個作文,怎么樣打分,怎么樣形成評語,才能達到以假亂真的程度?

  但是現(xiàn)在的核心問題是,由機器人寫作,寫出來的是打油詩還是水平很高的詩,這個“智能”程度是怎么測試的?

  所以圖靈測試又被提上了話題。尤其重要的是,最近全世界都在做智能駕駛,無人駕駛,駕駛驅(qū)動的圖靈測試怎么測。如果我們在路上看到一臺汽車,你是否分辨不出是機器人開的還是人開的?你是否分辨一個新手或者是老司機?是A駕照還是C駕照?圖靈測試在后圖靈時代已經(jīng)進入了我們的生活。

  谷歌公司是無人駕駛的領(lǐng)頭羊,2015年就聲稱跑了100萬英里,已經(jīng)達到人類75年的駕齡。但遇到一個最基本的問題,就是無人車上路怎么樣獲得駕照?因此駕駛認知度量已經(jīng)成為交管部門當務之急的問題。

  對我們科技工作者來說,腦認知如何度量,這是一個非常重要的科學問題。假如我們把圖靈測試的對象變成自動駕駛車輛,你區(qū)別不出是智能駕駛的汽車還是無人駕駛,那能不能叫圖靈測試,如果測試者坐在直升飛機上,看交通流,車子往前走,你區(qū)別不出哪一輛車是人開的,哪一輛車是機器人開的,可不可以說就達到了人的水平呢。

  但是無論是機器人對話,寫詩還是自動駕駛,有一點必須堅持:那就是允許測試者現(xiàn)場監(jiān)督和交互。測試者可以現(xiàn)場改變紅綠燈,看看車能不能停下來;可以制造一個汽車障礙,看看能不能避障;現(xiàn)場介入的交互是必須的。同時也要考慮一個情況:我們駕照路考的時候,同樣兩個人,水平差不多也很有可能一個人拿到駕照,另一個人沒拿到。因為有可能考官對一個人說,“你剛才超車的時候頭沒有往后看,我們規(guī)定頭要往后看的,所以本來應該下次再考,但是你態(tài)度比較好,你記住這件事,這一次給你過了就可以了。”因此我們認為圖靈測試本質(zhì)上盡管存在客觀性,但是必然帶有主觀性,如果一個駕駛員老不合格,這就會受到質(zhì)疑,何況駕照還可以收回,所以對圖靈測試也應該用這樣的觀點來看。

  駕駛圖靈測試的現(xiàn)實意義非常重要。汽車工程學會有一個自動駕駛的等級區(qū)分,分成L0到L5。有的廠家宣稱我要做L4的自動駕駛,有人說我只能做L3,我覺得輔助駕駛挺好。所以有一個問題,就是圖靈測試的問題。自動駕駛的等級轉(zhuǎn)換點如何度量,掌握權(quán)交界點如何度量,5級分類可操作點在哪里,要規(guī)定100個駕駛窗口還是1000個駕駛窗口,這還真是一個問題。

  我們在北京可以看到很多特斯拉的車,有的賣80萬,有的賣120萬,但是問駕駛員實現(xiàn)自動駕駛了嗎?駕駛員都會說基本上沒有。因為特斯拉聲稱是L2等級的自動駕駛,也就是需要駕駛員的手放在方向盤上,保持注意力。如果不這樣干,出了事故還是駕駛員的責任。所以圖靈測試的問題是一個現(xiàn)實的問題。

  二、擬人過程中的三種認知

  我們的觀點和特斯拉不一樣,和谷歌有區(qū)別,和英特爾也有不同,我們認為八個字,無人駕駛,難在擬人。無人駕駛不僅僅是車,不是做自動化就可以了,自動化遇到了天花板,人工智能來了。

  人的智商到底是怎么樣表現(xiàn)的,生物學家告訴我們,在微觀,宏觀維度上有不同的表現(xiàn)。比如說看到一個詞匯和聽到一個詞匯,人的興奮區(qū)和興奮度都會不一樣。所以告訴大家,所以告訴大家,記憶很重要。一個駕駛員頭腦里記錄了多少場景,能夠應付多少事件,怎么學習的,這點很重要。

  當人看周圍場景的時候,駕駛員是有選擇性注意的:同樣一個場景,小孩子和一個經(jīng)驗駕駛員看,注意點是不一樣的。我們很多人都做機器視覺,有人說是計算機視覺,確切說是圖像的處理和理解,我們叫做先視后覺。它無特定的任務驅(qū)動,所以我們進行分類,聚類,進行一些識別,形成一個全局的認知,現(xiàn)在很火。但是人類認知難道都是這樣的嗎?不是的,因為我們在做無人駕駛的時候,有一條堅定的信念,也是我們確定的一條原則,叫做傳感器不完美原則。不要想著哪個傳感器是完美無缺的,分布在車體各部位的傳感器都認為看到了全局。

  生物視覺和機器視覺的差別,視而不覺,無視后覺,邊視邊覺,先覺后視。在生物視覺選擇性注意當中,我們經(jīng)常聽到,大范圍優(yōu)先,或者大尺度有限,當你看一幅圖的時候,大圖很重要,細微的地方并不重視。另外,當你看到一副圖像的時候也會存在差異優(yōu)先。我們的問題是,在選擇注意力的時候,這幾個問題碰到一起到底誰優(yōu)先?我們研究的結(jié)果認為,真正的是記憶優(yōu)先,你頭腦里記憶的東西對當前情景的優(yōu)先選擇會發(fā)生很大的影響。

  現(xiàn)在很多人研究感知的智能,沒有人研究認知的智能。而我們就在研究認知的智能。腦認知主要表示在如何聽、說和如何看,而腦認知的內(nèi)涵是想,想的時候有三種認知,計算認知、記憶認知和交互認知。我曾經(jīng)在一個場合說過一點計算機負面的話,就是我們?nèi)祟悓τ嬎銠C的追求有一點貪得無厭,計算速度現(xiàn)在這么快,我們還要更快。但是我們沒有用精力研究記憶和交互,這是一個遺憾。我們在研究計算的同時,應該花更多的精力研究記憶和交互,這才是受腦認知啟發(fā)的人工智能。

  我們認為人類的認知沒有想象的那么復雜。將一句話,一件事反復地裝進你的頭腦里,你就形成了自己的認知。記憶是腦認知的核心,遺忘是人類智能的顯著表現(xiàn),沒有遺忘腦子將不堪重負。神經(jīng)生物學家告訴我們,人類記憶是分區(qū)的,瞬間記憶,工作記憶,場景記憶,有不同的劃分的區(qū)域和方法。遺忘是對記憶的不能再認和回憶,因此我們應該研究遺忘、記憶、存儲。認知過程可以用卷積表征體現(xiàn)出來。我個人定義了一個很重要的公式:記憶是認知函數(shù)和遺忘記憶的卷積。我提出用認知學的物理方法研究人的遺忘,一個圖片怎么實現(xiàn)遺忘過程的,在你的記憶里又是怎么恢復的,這件事情應該下決心研究清楚。記憶通常是非常豐富的,但是也是瞬間的,記憶是在海馬體里面,它和學習有很大的關(guān)聯(lián)。大腦的皮層的記憶已經(jīng)被抽象化了,所以人工智能的學者不能簡單研究計算,還要研究記憶,不但要研究學習和遺忘,還要研究三個不同記憶區(qū)的劃分方法。要研究工作記憶和場景記憶,怎么樣幫助當前的瞬間感知。人腦的計算沒有什么復雜的變化,就是一種相似計算,是我們復雜化了。

  交互是腦認知的重要形態(tài),交互的力度不一樣,各有各的不同,怎么樣實現(xiàn)轉(zhuǎn)換。人在與神經(jīng)網(wǎng)絡交互的同時,還有與外面世界的交互,獲得心得感知,所以交互具有二重性。對于無人駕駛來說,你要回答人的駕駛認知過程中必須回答的問題,就是人腦是如何定位的。大家都知道,做無人駕駛最難的技術(shù),就是實時定位,我們把大的坐標系叫做上帝坐標系,每個人看的都一樣,我們的智能體是以它為基礎(chǔ)的認知,因此我們提出對周邊環(huán)境進行實時定位以及映射,這樣才能知道我這輛車當前應該在什么地方,應該采取什么動作。而語言我們認為是圖像認知在不同抽象中的語義標注。要構(gòu)造不同尺度連接組的,三位一體的多個多層的卷積網(wǎng)絡。

  這時候我們看看計算機的局限性,計算機最主要的是CPU,腦認知的單元每層都有記憶智能,計算智能和交互智能,這樣才能建立起來。我們的觀點和特斯拉不一樣,和谷歌有區(qū)別,和英特爾也有不同,我們認為八個字,無人駕駛,難在擬人。無人駕駛不僅僅是車,不是做自動化就可以了,自動化遇到了天花板,人工智能來了。

  三、讓駕駛腦具備個性

  不同的人開車行為習慣不一樣,我們認為自駕車應該有個性,好像我們每個人開車都有個性一樣。駕駛技能的習得通常通過認知,關(guān)聯(lián),自主三個因素決定。

  我們有一點感嘆,現(xiàn)在的汽車可以做到100馬力甚至更高,但是汽車在認知方面還不如馬。馬是認知主體,老馬識途,車不如馬,現(xiàn)在無人駕駛遇到最大的痛點就是最后一公里,回不來。共享單車回不來,將來共享汽車,最后一公里回不來,共享汽車的商業(yè)化用途就無解。因此,要想實現(xiàn)無人駕駛為主的駕駛,最根本的問題到底是解決車還是解決人,我們發(fā)出一點不同的聲音。如果做解決車的問題,就把車的自動化做好,我們做一個軟件定義的機器來實現(xiàn)無人駕駛。如果解決人的問題,那就必須具有記憶,決策和行為能力的認知主體來進行自主駕駛。一字之差,差之毫厘,自動化學者和人工智能學者是有不同的觀點的。汽車的行為是由駕駛員決定的,無人駕駛難在擬人,因此我們要研究駕駛員行為學和駕駛員心理學,當在爆胎的時候,駕駛員的動作恰當嗎,我們要研究駕駛員的感知、記憶、控制和行為技巧,而不是一味的改良車輛動力學性能,實現(xiàn)自動駕駛。

  我們看看駕駛員的行為學和心理學,過去在交通運輸領(lǐng)域就有專門研究駕駛員的行為學和心理學,分為感知域,認知域,行為域。現(xiàn)在我們在做認知領(lǐng)域的深度學習,駕駛認知的核心是學習還是記憶,生活是記憶,駕駛也是記憶,駕駛員開車的時候都是在“算賬”,所以記憶很重要,每次駕駛都會結(jié)合對過去駕駛的記憶。學習是什么,學習是理解知識,形成記憶的交互過程,理解是信息的認知或已有認知的結(jié)果,而記憶彌散在神經(jīng)網(wǎng)絡之中,不去研究這樣的問題,做出的決策和結(jié)果出路不大。駕駛員的經(jīng)驗和臨場處理能力必須由駕駛員自己替代。我們現(xiàn)在開始往記憶和交互上發(fā)展,計算、操作系統(tǒng)ROS固然重要,但是它不能代表駕駛員。如果要說駕駛員的注意力,釋放駕駛員的認知,必須有一個物化駕駛員的認知,我們把特定的駕駛認知叫做駕駛腦,這樣以來就會注意力集中,永遠專注,永不疲勞,原來駕駛員發(fā)生的事故稱之為人類第一殺手,也就不再存在,這該多好。

  駕駛認知,自動駕駛是機器駕駛,它物化了駕駛員的認識,實現(xiàn)了無人駕駛。我們想一想,自動駕駛?cè)绻窃诘罔F比較好,因為鐵路是固定的,還有網(wǎng)絡調(diào)度。高鐵也可以做自動駕駛,因為道路是封閉的,調(diào)度能力很強,飛機也可以做自動駕駛。唯獨汽車不行,因為汽車是個人的代步工具,它在開放的不確定性的環(huán)境下,常常會遇到大雪、大霧、大雨。還比如紅綠燈失效,道路施工,車輛醉駕等等,如果不能處理這些情況,自動駕駛可能難以勝任。

  有經(jīng)驗的駕駛員,標桿駕駛員能夠靈活處置,但自動駕駛車輛怎樣學習呢,這是我們研究的重點。一個小孩能夠成功的抓住一只球,這是計算出來了嗎,不是。是用了什么算法嗎,也不是。一次又一次的學習,操練,久而久之,智能成為新的本領(lǐng)。我們認為開車和學英語本質(zhì)上是相同的,熟練的司機開車,如同自己走路一樣自然,開多了,不是每天都在計算。有經(jīng)驗的駕駛員,不但要符合駕規(guī),安全行駛,我們還要使車子坐起來比較舒服,從A點到B點怎么樣舒服省油,這也是駕駛員重要的技巧。

  因此我們發(fā)明了一個單詞,Driving Brain,不同的人開車行為習慣不一樣,我們認為自駕車應該有個性,好像我們每個人開車都有個性一樣。駕駛技能的習得通常通過認知,關(guān)聯(lián),自主三個因素決定。如果像特斯拉一樣,把傳感器放在車里,讓人工開車,開了兩年以后,拿回來一學習,再放回去讓它和你開車一樣。在路上的行為就成了自己的行為,人的感知和車的行為達到了合一的境界,這是我們追求的目標。

  我們十多年的自動駕駛的生涯告訴我們,這件事情很重要,如果沒有的話,我們?nèi)匀粫只?、迷茫,今天做的很好的,明天可能就做不好了。感知認知和行為有一個比較好的反饋過程,從動態(tài)感知到態(tài)勢分解,到自主決策,這個期間場景記憶,功能記憶都起到很重要的作用。四類傳感器,分別是激光雷達,攝像頭傳感器,車姿傳感器,還有GPS傳感器,這代表我們的感知系統(tǒng)。認知系統(tǒng)里,既有駕駛技術(shù),還有各種各樣的記憶棒,我們利用當前的駕駛態(tài)勢和時間序列表決策當前的認知,形成認知箭頭,控制車的動力和行為,這塊叫做小腦,因為它已經(jīng)有駕駛技巧了。

  從感知到認知到行動,我們2016年研發(fā)駕駛腦V1.0。原來開始開車準備時間十幾分鐘,現(xiàn)在我們開車啟動時間只要22秒,我們終于開始我們自己的發(fā)明,就是駕駛腦,它是給你拿駕照的,它是給你積累駕駛技能的,它是買路熟的,它是個性化駕駛和標桿駕駛。這些東西怎么靠自動駕駛完成的呢,這就是我們在全世界自動駕駛的浪潮中發(fā)出的自己微弱的聲音。我們認為人工智能的使命是加速汽車向人機交互的轉(zhuǎn)變。有了駕駛腦,有可能使汽車成為駕駛員自己,這是我們?nèi)祟愖非蠓浅S欣硐?,有意義的科技,我們很多人買聊天機器人,我們想汽車也應該是這樣的。智能駕駛專用實驗與評估環(huán)境,全國已經(jīng)批準了7個實驗場,這很有可能發(fā)展成為賽車手和賽車機器人的賽車場。

  機器人換人帶來一個新的行業(yè),就是后圖靈時代。也許是人機共生,共融,共發(fā)展的時候了。如果人腦的域的認知能力可以先局部地得到解決,比如駕駛問題,寫作問題,學英語問題等。如果在一個流動大巴車上,我們安排一個駕駛腦,安排一個聊天腦,不但會開車還會導游。慢慢發(fā)展下去,千千萬萬個特定的機器人認知腦,通過移動互聯(lián)網(wǎng),云計算和大數(shù)據(jù),是不是可以倒逼變成一個通用的人工智能呢或者強人工智能呢?我們一起來拭目以待。

  在無人駕駛的未來,車輛具備“智能腦”,既要與環(huán)境交互,也要與其他車輛交互?;ヂ?lián)互通,以此為基礎(chǔ),城市的交通問題也會得到很好的解決。要解決交通問題除了依靠車聯(lián)網(wǎng),還要依賴智能交通系統(tǒng)中的管理規(guī)劃、流量預測和分析、以及與互聯(lián)網(wǎng)、大數(shù)據(jù)技術(shù)的相互配合。在WGDC2017上的空間大數(shù)據(jù)+智慧交通峰會上,我們將在這里與您共話智慧交通的未來。

喜歡您正在閱讀的內(nèi)容嗎?歡迎免費訂閱泰伯每周精選電郵。 立即訂閱

參與評論

【登錄后才能評論哦!點擊

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回復{{item.replynum}}
    {{child.username}} 回復 {{child.to_username}}:{{child.content}}

更多精選文章推薦