時間:2016-03-12 10:00 轉載請尊重版權注明來源和作者
尾猿會網發布:3月9日,人工智能AlphaGo戰勝韓國棋手李世石引起巨大轟動,外媒“The Verge”在比賽結束后對AlphaGo背后的DeepMind公司聯合創始人德米斯·哈薩比斯進行了長篇訪談,哈薩比斯談到了他對人工智能未來的看法。
以下是文章全文:
DeepMind的AlphaGo戰勝韓國傳奇棋手李世石,點燃了空前的對人工智能問題的熱情。但是,這家谷歌子公司的AlphaGo計劃卻遠遠超出了它自身 - 甚至可以說它本身都不是重點。作為DeepMind的聯合創始人,德米斯·哈薩比斯(Demis Hassabis)在本周早些時候表示,DeepMind要做出“智慧解決方案”,對此他有一些想法。
哈薩比斯自己走了個不尋常的路去達到人生目標,現在回想起來這卻是一個完美的道路。哈薩比斯是一個在智力奧林匹克競賽中5次獲得冠軍的國際象棋神童。他聲名鵲起則是年輕時在英國Bullfrog和Lionhead游戲開發公司工作,在那里他致力于開發一款類似于“主題公園”、“黑與白”的人工智能游戲,后來他成立了自己的工作室。哈薩比斯在00年代中期離開了游戲行業去讀完神經科學的博士學位,2010年他與別人聯合創立了DeepMind公司。
在AlphaGo首次戰勝李世石后的清晨,哈薩比斯坐下來接受The Verge的訪談。他在進屋時評論著首爾四季酒店(注:比賽地點)的燈光布景,給人的感覺十分溫馨友好。當一個谷歌代表告訴他,昨夜有3300篇韓國媒體文章報道了他,他明顯看起來非常吃驚。 “這令人難以置信,對吧?”他說, “看到一個深奧難懂的事物開始流行起來,這很有趣。”
除了AlphaGo,我們的談話觸及視頻游戲、下一代智能手機助手、DeepMind在谷歌公司中的角色、機器人、AI如何幫助科研等等。
注:本次采訪內容已被輕度編輯,以便于閱讀。
The Verge 記者薩姆·貝福德(Sam Byford):對于那些不了解人工智能或圍棋的人,你會如何描述昨天所發生的文化共鳴?
德米斯·哈薩比斯:對于這些我要說幾點。圍棋一直是完全信息博弈的巔峰。它在可能性方面比國際象棋更復雜,所以它一直是人工智能研究領域努力尋求突破的重大挑戰,尤其是在“深藍”之后。你知道,即使付出了很多的努力,我們還是沒有走出太遠。蒙特卡洛樹搜索是十年前一個很大的創新,但我認為我們成功地用AlphaGo給神經網絡引入了“直覺”——如果你想這么叫的話,而正是這些直覺讓某些人成為頂尖棋手。我很驚訝,即使是現場解說邁克爾·雷德蒙德(Michael Redmond)也很難算出結局,他可是一個職業9段棋手!而這表明了你是有多么難寫出圍棋的“評價函數”(valuation function)。
問:當你看到AlphaGo的特殊舉動,你會感到驚訝嗎?
是啊。我們相當震驚,我認為李世石也是,從他的面部表情就能看出來。AlphaGo的那步棋深深地打入了李世石的領地。我認為這是一個相當意外的舉動。
問:是因為(這步棋的)侵略性嗎?
嗯,是因為侵略和大膽!此外,它在比賽中戲耍了李世石。李世石以好戰而聞名,這就是他所傳達出的,我們期待的那種東西。本場比賽一開始,他就在整個棋盤上求戰,但是沒有一處是真的。傳統的圍棋程序在處理這種情況時非常無力。他們在局域計算中并不差,但是在需要通盤視野的時候會很無力。
問:舉行這次比賽的一大原因就是評估AlphaGo的能力,無論輸贏。你從昨晚學到什么?
好吧,我想我們了解到:我們已經沿著這條線走出了很遠 ——沒有超出我們的預期,但達到了我們的期望。我們要告訴大眾,我們認為比賽是五五開。我認為這仍然可能是正確的,這兒任何事都有可能發生,我知道李世石今天回來后會采取不同的策略。所以,我認為尋找出對手策略將是非常有趣的。
剛才談到了AI的意義,回答了你的第一個問題。另一個我要告訴你的事情是,我們和深藍是不同的。深藍是一個“手工”程序——程序員從國際象棋的規則中提煉出信息和獲得啟發。而我們的AlphaGo擁有學習能力,它通過實踐和學習獲得知識,這更像人。
問:如果在系列賽中AlphaGo繼續以這種方式取勝,接下來會發生什么?未來會有一個人工智能的游戲對決嗎?
哈薩比斯:我認為作為圍棋是完全信息博弈的巔峰。當然,我們還有其他頂尖棋手要比賽。此外,其他的游戲 ——像無限押注的德州撲克就非常困難。多人比賽會有其他的挑戰,因為它是一個不完全信息博弈。再有明顯的就是,人類在玩《星際爭霸》這類游戲時比電腦更好。戰略游戲需要在一個不完全信息的世界里擁有高層次的戰略能力。而圍棋的事情是很明顯的,你可以在棋盤上看到一切,因此,這對于電腦來說更容易一些。
(人工智能)打敗《星際爭霸》這些游戲你個人會感興趣嗎?
也許吧。我們只對研究項目主線范圍內的事情感興趣。所以DeepMind的目的不只是打游戲,盡管那非常有趣而且令人興奮。你知道,我喜歡玩游戲,我以前編寫過電腦游戲。但是那僅限于作為測試平臺,用于嘗試寫出我們的算法思想和測試出它能到多高等級、能玩得多好,這是一個非常有效的方式。最終,我們希望能應用到現實世界中的重大問題。
問:90年代末,我在英國長大,當時我在電腦雜志上看過你的名字,你的名字常常和游戲聯系在一起。當我第一次聽說DeepMind,看到你名字時,我在想:“真是絕配。”之前你在游戲行業的職業經歷對于現在所做的工作有何影響?
哈薩比斯:類似DeepMind的東西一直是我的終極目標。從某種意義上來說,我在這方面的計劃已有20多年時間。如果你從這種角度來看,即我所做的一切都是為了最終進軍人工智能領域,那么可以發現我的選擇是合理的。如果熟悉我在Bullfrog等公司的工作,那么你會知道,人工智能是我所做一切的核心。很明顯,(Bullfrog創始人之一)皮特·莫里諾克斯(Peter Molyneux)的游戲也都是人工智能游戲。
16至17歲時,通過開發《主題公園》,我意識到如果繼續發展人工智能,那么人工智能將發揮巨大的力量。我們賣出了數百萬個拷貝,而許多人都喜歡這款游戲。正是由于人工智能的存在,這款游戲才可以適應玩家。我們隨后繼續進行開發,而我也在游戲行業的職業生涯中試圖繼續發展這一技術。
隨后,我退出了游戲行業,回到了學術界,從事神經科學的研究。因為在21世紀00年代中期,我感覺通過游戲這扇“后門”去展開人工智能研究已經非常困難,因為游戲發行商只想要游戲。
問:當時,游戲是否是人工智能唯一顯而易見的應用?
哈薩比斯:是的,我認為是這樣。實際上我認為,當時我們正在開發技術極其領先的人工智能。我想說的是,那時學術界還停留在90年代,而所有新技術都尚未普及,也沒有得到大規模應用,例如神經網絡、深度學習和強化學習。因此,最優秀的人工智能技術存在于游戲之中。
當時的技術不同于我們目前開發的學習型人工智能,而更多的像是有限狀態機。但這些系統很復雜,并且具有自適應性。類似《Black & White》的游戲采用了強化學習技術。我認為這是到目前為止游戲中最復雜的人工智能應用案例。不過到2004至2005年,很明顯游戲行業走上了與90年代不同的發展方向。90年代的游戲很有趣,具有創新性。當你想到一個點子時,就可以將其開發出來。而到00年代,游戲更強調圖像、內容IP,類似FIFA的游戲大行其道。因此,游戲行業不再有趣。
在游戲行業,我做了能做的所有一切,在成立DeepMind之前我需要收集好必要的信息。這就是神經科學。我希望從大腦解決問題的方式中獲得靈感。因此,沒有什么其他方式比攻讀神經科學的博士學位更好。
問:這些或許是唾手可得的果實。你是否會將人工智能的技術進步應用在今天的游戲中?
哈薩比斯:我認為將會很有趣。實際上,近期EA也有人聯系我,我們應該去做這件事。但現在的情況是,我們有很多事情可做!這些技術通用性很強,我愿意去做這件事,但問題是人的精力有限。目前,我們的關注重點是醫療和推薦系統,以及諸如此類的應用。但或許未來我們會去做游戲,這對我來說這形成一個閉環。實際上,在游戲中設計自適應的人工智能對手將創造一個巨大的市場。我認為,相對于為每款游戲開發新的人工智能技術,開發者會更喜歡這種模式;蛟S他們只需要針對每款游戲去訓練通用的人工智能即可。
問:我可以想象,當你在家里打電子游戲時,相對于我,游戲中虛擬人物的表現會更讓你失望。
哈薩比斯:是的,大型多人游戲和其他類似游戲總是令我感覺失望。我從來都無法真正融入游戲,因為虛擬人物看起來傻傻的。他們沒有記憶,不會改變,也與環境無關。如果有學習型人工智能,那么游戲質量將提升至新的水平。
關于醫療
問:本周你談到,人工智能未來的主要用途將是醫療、智能助理和機器人。能否詳細談談。例如關于醫療,“沃森”已經在癌癥診斷領域有過一些嘗試。那么,DeepMind能帶來些什么?
哈薩比斯:目前還處于起步階段。幾周前,我們宣布了與NHS(英國國民醫療系統)的合作,但我們最開始將建設支持機器學習的平臺。根據我的理解,沃森與我們所做的工作有很大不同,更像是一個專家系統。因此,這是一種類型完全不同的人工智能。這類人工智能所做的是基于醫療圖像的診斷,或是追蹤生命指標,以及長期的“量化自我”,幫助人們養成健康的生活習慣。我認為,強化學習非常適合這一領域。
問:關于與NHS的合作,你們宣布了一款應用,但這款應用似乎沒有用到太多的人工智能和機器學習技術。背后的考量是什么?NHS為何要用你們的應用,而不是其他公司的軟件?
哈薩比斯:據我所知,NHS的軟件相當糟糕,因此我們要做的第一步就是讓軟件具備21世紀的設計。這些軟件并不存在于移動端,與用戶目前習以為常的產品也很不相同。我認為,這令醫生和護士們感到失望,也妨礙了他們的工作進度。因此,第一步是幫他們獲得更實用的工具,例如可視化和基本的數據統計。我們將開發這樣的工具,看看我們的狀況,隨后再引入更復雜的機器學習技術。
問:銷售難度會有多大?很明顯,在英國,醫療資金是一個持續討論的話題。
哈薩比斯:我們目前是免費去做,因此推廣難度不大。這與大部分軟件公司都有所不同。目前,開發這類軟件的大多是跨國公司,因此它們并不是非常關心用戶。我們的開發方式更類似于創業公司,你會去傾聽用戶的反饋,并與他們共同設計。
關于智能手機助手
問:讓我們來談談智能手機助手。我看到你在演講幻燈片中貼出了一張來自電影《她》的劇照。這代表了最終目標?
哈薩比斯:不是這樣。我的意思是,電影《她》是主流人群看待智能助手的一種簡單方式。我們需要智能手機助手變得更智能,更好地理解環境,并對你正在從事的工作有更深的理解。目前,大部分這類系統還很簡單:一旦你脫開預設的模板,它們就變得毫無用處。因此關鍵在于讓這樣的助手具有更好的適應性、靈活性,同時更強大。
問:這方面的發展需要什么樣的突破?我們為何不能立即著手去做這件事?
哈薩比斯:實際上我們可以,你所需的只是不同的方法。這里再次出現了預編程和后天學習的不同。目前,許多智能手機助手針對專門的應用場景進行預編程,因此只能處理預編程范圍內的邏輯,F實世界非常復雜,用戶會從事各種各樣難以預料的事,你不可能提前預測。DeepMind認為,實現智能的唯一方法在于從頭開始學習,并確保通用性。這也是我們生存的基本法則。
問:在起步之初,AlphaGo被教給了許多棋型模式?紤]到用戶的輸入信息多種多樣,這種技術將如何應用至智能手機?
哈薩比斯:是的,數據量很大,你可以利用數據去學習。但就AlphaGo的算法而言,我們認為可以不再規定受控的學習起點,完全放手讓其自學,從零起步。我們將在未來幾個月進行這樣的嘗試。這會花更長的時間,可能是幾個月,因為不按棋譜隨機下棋意味著更多的嘗試和試錯。但我們認為,這種純粹依靠自學的模式是可行的。
問:出現這樣的可能性是否是由于算法已發展到目前的程度?
哈薩比斯:不是的。我們之前也可以這樣做。這樣做不會讓程序更強大,這只是為了嘗試純粹的自學,擺脫人為控制的部分。我們認為,這一算法可以在不受控的情況下運轉。我們去年讓人工智能去玩Atari的游戲,人工智能從像素點的研究起步,這其中沒有摻雜任何人類知識。人工智能從屏幕上的隨機像素開始。
問:讓人工智能玩游戲更簡單,這是否因為游戲中的失敗條件很明顯?
哈薩比斯:玩游戲更簡單是因為分數更有規律。在圍棋比賽中,你只能得到一個分數,這就是結束時勝負。這被稱作“信度分配問題”。在圍棋比賽中,你做出數百次行為,但卻不知道哪一次會帶來勝利或失敗,因此信號強度很弱。在Atari的游戲中,你所做的大部分操作都會帶來得分,因此你會有更多的信息反饋,幫你知道如何去做。
問:能否給一個時間表,即人工智能何時能給普通人使用的手機帶來明顯不同?
哈薩比斯:在未來2到3年里,你就會看到這些。不過,起步之初的情況可能會比較微妙,某些方面還需要改進。而在4年、5年,或是5年之后,你將看到性能的大幅提升。
關于
問:在你提到的未來所有可能性中,智能手機助手與谷歌整體的關聯度最大?
哈薩比斯:是的。
問:谷歌是否暗示過你們,期望你們的技術如何融入谷歌的產品路線圖,或是整體商業模式?
哈薩比斯:不,我們有很高的自由度,可以按照我們自己的意愿去優化研究進展。這是我們的使命,也是我們加入谷歌的原因。加入谷歌使我們得到加速,過去幾年的情況已然如此。當然,我們會開發谷歌的許多內部產品,但這些產品都處于極早期的階段,因此還沒有到討論的時機。我認為,智能手機助手將是非常核心的產品,而谷歌CEO桑達爾·皮查伊(Sundar Pichai)也說過,這將是谷歌未來的最核心。
問:谷歌也有Google Brain等其他項目,同時也推出了諸如Google Photos搜索等面向用戶的機器學習功能。
哈薩比斯:這類技術無處不在。
問:你們是否與Google Brain有過互動,雙方的關注點有沒有重合之處?
哈薩比斯:我們的互補性很強,每周都會溝通。Google Brain專注于深度學習,而他們有杰出的工程師,例如杰夫·迪恩(Jeff Dean),因此他們將技術傳播至公司的每個角落。這也是為何我們看到Google Photos搜索等強大產品的原因。他們的工作成果是現象級的。他們常駐加州山景城,因此與產品集團的聯系更多,并采用12至18個月的研發周期,而我們更多地關注算法開發,周期通常為2到3年,且我們在起步之初并不直接關注產品。
問:谷歌對AlphaGo的支持有多重要?如果沒有谷歌,你們還能不能取得這一成就?
哈薩比斯:非常重要。AlphaGo在比賽中并沒有使用龐大的硬件,但我們需要大量的硬件資源去訓練它,并制造多個版本,讓它們在云計算平臺上對弈。只有獲得龐大的硬件資源才能高效地做到這一點。因此如果沒有谷歌的資源,我們不可能在當前這個時間段就取得這樣的成果。
關于機器人
問:關于機器人。我常駐日本,而日本自認為是機器人的精神家園。在日本,我看到機器人的用途有兩方面。一方面,發那科制造了工業機器人,被用于多種場合。另一方面,我們也看到了類似軟銀Pepper的禮賓機器人,這些機器人有著遠大的目標,但使用場景很有限。對于這一領域,你的看法是什么?
哈薩比斯:正如你所說,發那科的機器人在“肢體”上非常強大,所欠缺的是“智力”。禮賓機器人則有點類似智能助手。不過我所見到的這些機器人都經過預編程,只是按照模板做出響應。如果超出模板,那么機器人就不知所措。
問:我感覺,最顯而易見的問題就是,機器學習之類的技術將如何提高機器人的能力。
哈薩比斯:這將是一種完全不同的方式。你需要從頭開發,讓機器人學習新東西,處理不可預期的事件。我認為,這才是在現實世界中機器人和軟件與真實用戶互動的方式。它們需要這類能力,從而發揮用處。因此,應當為機器人制定適當的學習路線。
問:你認為,學習型機器人短期內會有什么樣的使用場景?
哈薩比斯:我們還沒有太多地思考這一問題。很明顯,無人駕駛汽車就是一種機器人,但目前這基本是一種狹義人工智能。不過,計算機視覺利用了學習型人工智能的某些方面,例如就采用了基于深度學習的標準計算機視覺技術。我可以肯定,日本已經在思考諸如老人看護機器人,或家政機器人之類的產品,這對社會,尤其是老齡化社會來說很有意義。
問:對于這些使用場景,基于學習的方式為何更適合?
哈薩比斯:你只要想想這些問題:為什么我們還沒有這樣的技術?為什么我們還不能讓機器人來幫你打掃衛生?問題在于,每個人的家中布局和家具都不相同。而即使是同一所屋子,每天的狀態也在改變。某些時候亂糟糟,某些時候又很整潔。因此沒有任何一種方式可以對機器人進行預先編程,針對你的屋子提供解決方案。你甚至還希望加入自己的偏好,例如你希望衣服怎么疊放。這是一個非常復雜的問題。這些事對人來說很簡單,但實際上這些任務相當復雜。
問:問個個人問題,你用掃地機器人嗎?
哈薩比斯:我們有一個,但用處不是太大。
問:我自己有一個,確實不是非常有用。我會去看看它掃的不干凈的地方,并再去打掃。因此我很好奇,我們何時會看到更先進的機器人,所謂“足夠好”的轉折點將于何時出現?
哈薩比斯:是的,我是說有可能。我認為,所有人都會以合理價格買一臺機器人,幫他們收拾盤子洗碗。這種簡單的掃地機器人很流行。實際上它們并沒有任何智能性。我認為,在這一發展道路上的每一步都是有用的。
哈薩比斯:我個人不是很關注機器人。我關心的是將這樣的人工智能應用至科學,推動科學更快地進步。我想看看由人工智能輔助的科學研究。屆時人工智能將成為研究助手,去完成大量冗繁的工作,找出有趣的文章,在海量數據中找到數據結構,將這些信息呈現給人類專家和科學家,幫助他們更快地取得突破。幾個月前,我曾向歐洲粒子物理研究所(CERN)做過一次演講:相對于地球上的其他人,他們制造出了更多數據。我們都知道,在這些海量數據中可能會蘊藏新粒子的信息,但由于數據量太大,沒有人能完成分析。因此我認為,如果某天人工智能可以參與尋找新粒子,那么將會很酷。(邊策 維金)
此文由尾猿會網發布( 原文出自新浪科技)
相關內容
精彩推薦
熱點新聞