愛伊米

AI玩遊戲,不是為了贏而是提升智力

AI玩遊戲,不是為了贏而是提升智力

1996年2月16日,IBM公司的計算機程式設計師在紐約阿蒙克IBM總部拍下“深藍”與卡斯帕羅夫之間著名的國際象棋世紀之戰

我們正邁進一個嶄新的AI世界。

Forbes

作者丨

Annie Brown

編譯整理丨

科技行者

隨著AI逐步進軍策略遊戲領域,人類玩家還有必要繼續“負隅頑抗”嗎?考慮到AI能夠不斷從錯誤中吸取教訓、藉助一場場比賽提升自身水平,答案恐怕是否定的。更恐怖的是,計算機的對戰速度遠遠超過人類——玩得快、學得更快,這還比什麼?

很多人要玩一輩子才能成為撲克高手,但AI沒準一晚上就能傲視群雄。這樣的基本現實,也給策略遊戲世界帶來種種變數。

作為一個不斷髮展的新興領域,不少朋友對於AI並沒有很直觀的感受。非技術人員接觸AI的一種常見方式就是線上撲克遊戲,人類玩家會在其中與AI相對抗。這就引出了新問題:到什麼時候,我們才分不清是在跟人玩、還是跟AI玩?

近年來,AI取得了長足進步,並在多款策略遊戲中表現亮眼:國際象棋、拼字遊戲、圍棋以及撲克等等。其戰線之輝煌,甚至讓人類幾乎提不起與之對抗的念頭。

例如,微軟最新發布的“Libratus”就在比賽中一舉擊敗四位頂尖德州撲克高手,自己連汗都沒出。

Libratus是由卡耐基梅隆大學開發的AI程式,在為期20天的匹茲堡Rivers Casino德州撲克比賽中力壓四位人類高手。而這一結果,也開啟了AI策略遊戲探索之路的新方向。

在本文中,我們將探討如何將AI應用於撲克遊戲、AI又會表現出怎樣的發展前景。

一項最新研究發現,最出色的電腦撲克選手跟人類一樣很擅長虛張聲勢,Liberatus則用實際行動證明不是一樣、而是更擅長。那麼是不是在可預見的未來,計算機會在一切策略遊戲中都壓倒人類?

根據職業撲克選手Jeff Gross的說法,這種可能性確實存在。Gross曾在18年前以50美元作底,一路過關斬將拿下超過500萬美元的職業錦標賽收入。Gross對各種賭注極高的遊戲都很精通,最近又開始轉向內容創作。他在自己的Twitch頻道上向80000多名粉絲講解撲克技巧,播客節目也已經制作了150多集。

作為最頂尖的撲克高手,Gross對這波來勢洶洶的AI入侵也有點迷茫。他解釋道:“我們可以從兩個角度理解這個問題。如果AI能力可以持續增長,那麼撲克遊戲中最精妙的部分、也就是誤導對手的能力,很可能被計算機所超越。但另一方面,由於騙倒機器特別困難,所以跟AI對抗反而非常有趣,甚至未來撲克遊戲的對手就可以全都換成AI技術了。以後的鉅額資金很可能被交給那些能擊敗AI的選手,我個人對人類的學習力和潛能充滿信心。”

回顧AI技術在策略遊戲中的發展歷程,我們很容易理解Gross的複雜情緒。上世紀八十年代初,國際象棋世界冠軍、也是有史以來最成功的棋手之一加里·卡斯帕羅夫曾經做出一個大膽的預測,即沒有任何國際象棋程式能夠打敗他。加里在1989年兩度擊敗了IBM的國際象棋AI“深思”(Deep Thought)。幾年之後,卡斯帕羅夫又在多局賽中擊敗了深思的繼任者深藍。但很遺憾,他在與深藍的複賽中創下另一項紀錄——成為第一個被國際象棋AI擊敗的世界冠軍。

AI玩遊戲,不是為了贏而是提升智力

圖:Jeff Gross

從那時開始,AI逐漸在策略遊戲中佔據了主導地位。快進到2019年,當時的世界衛冕冠軍Magnus Carlsen在與最強國際象棋程式的100場對弈中一場未勝。可以說從1946年的圖靈到現在,人類終於創造出了接近完美、甚至可以說已臻完美的國際象棋AI。

而撲克遊戲的攻克,代表這段旅程又前進了一步。自1984年以來,AI開發者一直高度關注德州撲克遊戲。那一年,Mike Caro開發出一款名為Orac的基礎撲克AI軟體,並帶著它參加了世界撲克大賽。

根據最近公佈的資訊圖來看,從Caro的Orac到卡耐基梅隆大學的Liberatus,撲克AI實現了長足發展。Gross則對撲克AI的強勁發展勢頭毫不意外。

“AI能這麼強並不奇怪。這些程式已經透過分析數百萬甚至數萬億手牌識別出幾百萬種不同的策略。在與人類對手打牌時,AI可以輕鬆識別出對方的策略並建立起能夠勝出的機制。雙方都可以虛張聲勢、也都可以用梭哈震懾對手,但人類的誘導能力仍然有限,因為錢對我們來說有意義。但AI會對每個人都採取威壓策略,並透過混合策略讓對手更難摸清它的真實意圖。”

而且事實上,AI並不懂得如何虛張聲勢、至少跟人類選手的虛張聲勢並不相同。AI只是在訓練中逐漸意識到,即使自己手頭的牌不怎麼強、仍然可以透過持續跟注賺取回報。它會不斷遇到類似的情況、持續加深自己的這種認識,這樣的可能性也讓AI在撲克遊戲中佔據了對人類的比較優勢。於是,AI相對不易受到虛張聲勢的影響、而且並不害怕過度跟注。

Gross認為,未來的撲克遊戲會迎來幾條演變分支:跟AI國際象棋程式類似,未來的撲克遊戲也會發展出AI對AI的比賽,人類選手則繼續跟自己的同類對抗;或者,也可能出現某些混合賽事,由最高水平的人類在撲克等策略遊戲中嘗試挑戰AI。

如今,Gross預測的第一部分已經在國際象棋領域成為現實。國際象棋已經發展出一套強大的AI儲備池,其平均棋力等級已經遠遠超過人類選手。目前AI世界冠軍Stockfish 9的棋力ELO評分為3438,遠遠高於人類世界冠軍Magnus Carlsen的2845。

Gross也很能理解AI開發者為什麼會對撲克及其他策略類遊戲充滿興趣。用他的話說:“據我瞭解,AI的終極目標就是幫助人們解決日常生活中經常出現的問題。類似撲克遊戲,我們能看到的只有一些不夠全面的資訊。AI需要解決的問題,都在撲克遊戲中有所對映。所以從樂觀的角度出發,撲克遊戲正在訓練AI、讓它的智慧水平持續提升。這也側面證明了撲克遊戲自身的精妙與複雜。”

Gross的觀察完全正確,AI開發者確實希望達成這樣的目標。策略遊戲並不是目的,只是一種手段。世界冠軍們也不必介意輸給AI程式,畢竟只要這樣能推進AI技術的發展,那麼他們自己也能在手機上享受到AI帶來的便利功能——例如幫他們快速試探出對方能接受的底價。

可以說,AI技術的志向要宏大得多。我們正邁進一個嶄新的AI世界,為了讓這個世界真正如想象般美好,每個人都需要忍耐路途上的一點顛簸。你說呢?

-END-