還惦記著我的下棋絕殺吶?!曾經的輝煌如浮云,寶寶們快來看我的新寵:打游戲!——AI の OS
北京時間3月15日上午最新消息!
人工智能(AI)系統能夠學會一款雅達利(Atari)游戲,然后利用這些知識再學習另一款游戲!
時光機biu→2014年
DeepMind的機器學習系統學會玩雅達利游戲,大獲公眾矚目。它可以把游戲打通關,得分直接秒殺人類,卻不記得它是怎樣做到的。
該系統玩每一款雅達利游戲時,都要單獨創建一組神經網絡,因此,如果不能同時為人工智能輸入《空間入侵者》(Space Invaders)和《打磚塊》(Breakout)的信息,就不能在同一個系統上玩這兩款游戲。
(雅達利游戲)
醒醒~~醒醒
現在,倫敦帝國理工學院的研究人員已經給一組DeepMind創建了一種算法,允許該系統的神經網絡自主學習,保留信息并再次使用它。
DeepMind的研究科學家詹姆斯·基爾克帕特里克(James Kirkpatrick)和其發表在美國國家科學院學報上的小語錄,解釋了DeepMind的AI系統如何運用監督學習和強化學習測試等方式來不斷學習:
1、以前我們有一個系統可以學著玩任何游戲,但它一次只能學會玩一款游戲?,F在的新系統可以一個接一個地學習玩幾個游戲。我們的方法是通過有選擇性地減慢高權重任務的學習速度來記住舊的任務。
2、不斷完成學習任務而不遺忘的能力是生物和人工智能的核心組成部分。
3、為了讓AI系統擁有記憶,我們開發了一種名為“彈性權重固化”(EWC)的算法,可以選擇在游戲中成功通關的做法,并把最有用的部分保留下來。
4、我們只允許它們(在游戲間)非常緩慢地做出改變。如此一來,我們就有了學習新任務的空間,但是我們所進行的改變不會覆蓋我們以前學過的東西。
然而,這套系統還不完美。雖然它能夠學習以前的經驗,并保留最有用的信息,但它的神經網絡無法像只完成一個游戲那樣運轉良好。
暢想未來
已證:AI系統能夠不斷學習
未證:它的學習效率有所提高
下一步:利用和規范連續學習,嘗試和改善它在現實世界的學習活動。
AlphaGo 獲勝一周年