AlphaGo之父戴密斯·哈薩比斯 天才領導者和生活里的普通人
2017年10月18日,DeepMind團隊公布了代號為AlphaGo Zero的最強版阿爾法圍棋。哈薩比斯一直以來都想創造一個能夠像人類一樣“學習”如何玩游戲并達到高水平的AI,在他看來,AlphaGo并非人們認為的“機器”,“就好像和人類一起探索宇宙的哈勃望遠鏡一樣,AlphaGo是和我們一起探索圍棋的哈勃”。
他一直極其堅定地相信AI能夠幫助人類以更快速度取得更大突破。像哈薩比斯這類“謝耳朵”型男生通常都做事專注認真但木訥、不善溝通,但哈薩比斯的難能可貴之處就在于他在帶領團隊的過程中還培養了在多種環境下工作的能力并逐漸成長為善于表達的溝通者。
他經常以深入淺出的方式向大眾介紹自己復雜的工作以及這些工作有何重要意義。他娓娓道來地去分解描述DeepMind是如何把傳統AI技術和新技術進行結合的,比如在圍棋上,DeepMind結合了傳統“樹搜索”的方法和模擬大腦神經元的“深度神經網絡”,并巧妙地融合了多種不同的AI技術。
他曾在做客BBC時講到,在AI領域深度學習和強化學習是最讓他興奮的兩件事,前者用于識別,后者用于決策,AlphaGo就是兩者結合的產物。DeepMind將采用處理長期規劃的更深層次的強化學習技術引入AlphaGo中,而不是簡單地采用預編程系統按既定步驟下棋。
依靠增強學習系統,AlphaGo可以汲取人類棋手比賽的營養,然后開創自己的打法。未來DeepMind還將整合記憶等其他功能,“將所有這些不同領域整合在一起是關鍵。因為我們感興趣的算法能夠將針對某一領域的學習經驗應用至新的領域”。
新技術的引進使得AlphaGo Zero能力卓越,與同類程序對弈勝率高達99.8%。能夠達成這樣的結果除了新技術的原因,還源于哈薩比斯對“智力(Mind)”的認知,“AlphaGo以人類的方式去下棋。它也是按照人類的方式去學習的,像你和我一樣,在不斷練習中技能得以提高”。
曾經擊敗國際象棋冠軍的深藍,需要國際象棋大師和程序員組成團隊來教它下棋的技巧。不斷進化的AlphaGo Zero,就像一個初生的嬰兒,在圍棋世界里面對既定規則和要贏的目標,先學習走路,在無數次自我對抗中完善自我理解與認知,產生了直覺。慢慢地,它不僅能掌握人類大師下棋的技能,還會自己發展出一些新的技能,并用這些技能摧毀人類智慧的壁壘。
隨著AlphaGo變得聲名卓著,哈薩比斯也獲得了許多榮譽,包括“亞洲獎”年度科技最佳貢獻獎、英國皇家學會頒發的“穆拉德獎”(Mullard Award)、Nature雜志評選的“年度十大人物”、《時代》提名的全球最具影響力100人等等。
堅持探索通用AI
哈薩比斯給自己設定的終極目標是理解時間、黑洞以及人類在整個宇宙中的真正地位,通用AI是他到達這一星辰大海的途徑。讀博時,哈薩比斯就開始尋求在人類大腦中尋找新的AI算法的靈感了。
2007年,他發現5位失憶癥患者因為海馬體受損而很難想象未來,這證明了大腦中以往被認為只與過去有關的部分對于規劃未來也至關重要。這些年,在AlphaGo獲得了不起的成功的同時,哈薩比斯堅持對通用AI的探索,帶領DeepMind做了很多大事:
2016年底,DeepMind開源了其核心深度學習平臺之一“DeepMind Lab”供研究人員和開發者使用。這是一套為玩游戲的智能機器人打造的娛樂學習游戲平臺。開源之后,全世界的研究人員和開發者都可以在上面發揮才智,為AI發展群策群力。
同一時間,DeepMind還公布了一臺“可微分神經計算機”(DNC),簡單理解就是這臺機器既能像人類一樣思考,又能像計算機一樣進行高速運算和記憶數據,使得“機器”向“人”更邁進了一步。
為了讓“機器”更像“人”,DeepMind在圖像生成和語音生成領域也有超前研究,其2016年公布的語音生成系統WaveNet據稱將計算機輸出音頻與人類自然語音差距縮小了50%。
醫療是哈薩比斯強調的AI需要落地的領域。DeepMind Health是智能醫療系統,其根據與英國全國醫療系統合作獲取的數據打造基于AI的診療和癥狀判斷幫助;Alpha Fold能根據基因序列來預測蛋白質的3D結構,在有“蛋白質結構預測奧運會”之稱的CASP比賽中力壓其他97個參賽者奪冠,為醫療領域變革、新藥物研發奠定了理論基礎。
DeepMind還運用AI系統優化了冷卻系統的用電效率,據說一次性幫谷歌節省了上億美金的開銷。2018年底,Alpha Zero只用一個算法就在圍棋、國際象棋和將棋三個領域奠定了霸主地位,并因此登上了《科學》封面,被評價“能夠解決多個復雜問題的單一算法是創建通用機器學習系統,解決實際問題的重要一步”。
打造通用AI并不容易,DeepMind另辟蹊徑,從現實生活中獲得靈感,把解決方案提煉總結為“在許多不同的可能組合中選擇正確的路徑”。他認為,在可以預見的將來,AI會像科學家一樣工作,提出假設并設計實驗來驗證假設,然后“取得可能獲得諾貝爾獎的重大突破”。
為了推進通用AI發展進程,哈薩比斯甚至還非常少見地親手寫下長篇文章,發表在神經醫學界的頂級刊物《神經》中,提出“假如我們的目標是開發出接近或同等于人類智慧的智能技術,那么就絕不能放棄對人腦的研究和理解,因為人腦是唯一能夠證明這種智慧存在的證據”的鮮明觀點。
目前DeepMind主要專注于兩方面的研究,一個是對前面提到的強化學習的深度探索,可能會與機器決策、物理世界處理等AI領域的技術相結合;另一個是AI可解釋性,既用心理學和神經科學來破解AI黑箱,同時也希望用強化學習等“AI原理”幫助探秘人類大腦。
這些研究的重要意義不在于得到了什么具體成果,而在于給跨學科研究做出了扎實的示范,證明了神經學補全AI的可行性,其非常關鍵的機器心智理論可能會成為主流研究方向。
而且,哈薩比斯認為,不僅AI需要向神經科學學習,對人類大腦與神經的研究今天也需要向AI學習。用強化學習機制來解釋人腦的運作模式被實驗證明解釋是正確的,那么對人類大腦機制的研究與模仿應該也可以加強對強化學習技術的理解和升級。
未來與記憶相關的AI技術或將成為DeepMind的研究重點,情景記憶、工作記憶、長期學習等技術很有可能成為突破方向。哈薩比斯的暢想是:通過AI來了解人類智慧,讓AI與人類大腦形成比對,或許可能“對人類心靈中一些最深刻和最持久的奧秘如創造力、夢想等產生深刻的見解,甚至能觸及意識的本質”。
天才領導者和生活里的普通人
作為企業家的哈薩比斯領導著Deepmind一個包括400名博士的共700名員工的團隊。被谷歌收購后,熱愛自己家鄉的哈薩比斯不愿搬遷,“我在北倫敦出生并長大,非常喜歡這座城市。倫敦沒有任何理由無法容納一家世界級的AI研究機構。我很驕傲我們能留在這里。”
DeepMind辦公樓的所有房間都以人類史上的天才來命名:特斯拉、拉馬努詹、柏拉圖、費曼、亞里士多德、居里夫人等。辦公環境是最有利于人們發揮創造力的設計,大樓的一樓有咖啡廳、有帶冰箱的會客室、桌上有足球游戲機。樓頂是一個可以看到倫敦美好風景的露天平臺,每周五晚上員工們在那里舉辦聚會。
公司匯聚了全世界最優秀的人才,類似波蘭物理奧賽的冠軍或者法國頂級的數學博士等,他們都看起來健康、愉快、酷,空氣中彷佛都彌漫著知識的味道。哈薩比斯花很多時間思考“DeepMind作為一種算法的效率”,他堅信自己能把事情做得更出色,因為公司融合了最優秀的學術氛圍和最令人興奮的創業文化。
這樣的環境和氛圍使得即使在谷歌最大的競爭對手大舉挖人之時,DeepMind的員工離職率也為0。作為公認的天才的哈薩比斯,并非電影里那種瘋狂地企圖做出一件轟動人類大事的科學家,或者生活中常見的表面木訥、內心狂野的“極客”,他很接地氣。
和絕大多數普通人一樣,他在該結婚的年齡成了家,妻子是一名意大利的分子生物學家,專注于阿茲海默癥的研究。他們育有兩個兒子,分別擅長科學和創造性活動。與絕大多數人的不同之處在于,哈薩比斯一天之內有兩個工作日。
他上午十點左右到辦公室協調、溝通、決策,引導公司保持世界領先地位。然后在晚上7點半搭乘地鐵準時回到距離他兒時生活地點不遠的家中,陪伴家人進餐,與孩子們一同游戲、讀書或是幫他們完成家庭作業。在把兩個孩子哄睡之后,他重新開始工作至凌晨一點,之后用幾個小時來進行深度思考,直至凌晨四點入眠。
那些震驚世人的想法都是來自深夜的思考。“完全是個超人”的哈薩比斯認為工作和生活“是同一塊畫布的不同部分”,他閱讀、看電影、聽音樂,但最終還是會回到工作上,變成他思考問題的引子。“在我醒來的每個時刻,工作都是我思考的問題,或許在夢里也是如此,這也是我最有熱情的一件事。”
哈薩比斯談到工作時的樣子能夠讓你相信工作真的是一件最有趣的事,“我感覺非常幸運,每個時刻我都在做自己真正堅信的事。否則,生命那么短暫,為何要去做這些?”所謂天才,其實很大的部分來自于專注。
關鍵詞: 哈薩比斯
責任編輯:hnmd004
- 鬼哭狼嚎是貶義詞嗎?暴跳如雷是貶義詞嗎?2023-06-14
- 公積金卡和工資卡可以是一張嗎?公積金可以2023-06-14
- 每日聚焦:追星的人是什么心態?追星有什么2023-06-14
- 茶黃金是什么東西?大紅袍屬于哪個茶類? 2023-06-14
- 什么是名義利率? 名義利率和實際2023-06-14
- 天天消息!tp-link路由器怎么樣?tp-link路2023-06-14
- 大盤股和板塊股的區別是什么?大盤股上市對2023-06-14
- 怎么買一個合適的外接閃光燈?使用外接式閃2023-06-14
- 計算機啟動修復要多久?啟動修復可以強制2023-06-14
- 每日消息!電腦顯卡風扇轉速怎么調?怎么在B2023-06-14
- 纖體咖啡有副作用嗎?咖啡喝多了對身體有什2023-06-14
- 基金清盤是不是賠慘了?基金一直跌會被清盤2023-06-14
- 美股的錢怎么轉回國內?為什么中國人不能買2023-06-14
- 購買空氣炸鍋需要注意哪些問題?如何清潔空2023-06-14
- 中國農業大學是211還是985?農業大學是冷門2023-06-14
- 焦點滾動:澳大利亞主帥:世界杯前43分鐘成2023-06-14
- 雞蛋怎么孵化成小雞?人工孵雞蛋最簡單的方2023-06-14
- 6月13日四川發布山洪災害藍色預警2023-06-14
- 五月天是什么時候出道的?五月天哪首歌曲最2023-06-14
- 天天熱點評!電競顯示器怎么選?哪個電競顯2023-06-14
- 股票為什么會產生異常波動?尾盤拉升第二天2023-06-14
- 勞動法年假規定怎么休?勞動法年假補償標準2023-06-14
- win10怎么取消開機密碼?win10密碼過期進不2023-06-14
- 如何升級客戶端版本?手機客戶端怎么打開?2023-06-14
- 世界快看點丨WIN10右下角天氣怎么關?win102023-06-14
- 喝咖啡不能提神怎么回事?喝咖啡一次喝多少2023-06-14
- 清倉和半倉有什么區別?北交所中簽100股能賺2023-06-14
- 申購新股最多可以配多少個號?新股申購配號2023-06-14
- 環球視訊!提前還車貸會影響征信嗎?車貸提2023-06-14
- 內馬爾和姆巴佩誰才是球隊老大?內馬爾和梅2023-06-14