談論遊戲 | 走向數據科學 - AI TAIWAN 台灣人工智慧中心

博弈論是一個在經濟學中非常重要的研究領域，但在其他科學領域卻不太受歡迎。然而，博弈論中的概念對更廣泛的觀眾也有趣，包括數據科學家、統計學家、計算機科學家或心理學家等。這篇文章是博弈論基礎的四章教學系列的開篇，敬請期待接下來的文章。

在這篇文章中，我將解釋博弈論所處理的問題類型，並介紹描述博弈的主要術語和概念。我們將看到一些通常在博弈論中分析的遊戲範例，並為後續章節深入了解博弈論的能力奠定基礎。但在深入細節之前，我想先介紹一些博弈論的應用，這些應用展示了博弈論概念可以應用的多種領域。

博弈論的應用

甚至薯條也可以是博弈論的應用。照片來源：engin akyurt，Unsplash

在選舉中，投票給一個小黨有意義嗎？如果這個黨可能根本沒有勝算？與提供相同商品的競爭對手展開價格戰值得嗎？如果你減少了過度捕撈區域的捕獲率，但你的競爭對手仍然照常捕魚，你會獲得什麼好處？如果你相信政府會在下一次颶風後支付重建費用，那麼你還需要投保嗎？在下一次拍賣中，當你準備出價購買你最喜歡的畢卡索畫作時，你應該怎麼做？

所有這些問題（還有很多其他問題）都屬於可以用博弈論建模的應用範疇。每當一個情況涉及與他人的互動和策略決策時，就可以應用博弈論的概念來正式描述這種情況，並尋找那些不是直覺上做出的決策，而是基於理性概念的決策。上述所有情況的關鍵在於，你的決策依賴於其他人的行為。如果每個人都同意保護過度捕撈的區域，你會想要一起參與以保護自然，但如果你認為其他人會繼續捕魚，那麼你為什麼要成為唯一停止的人呢？同樣，你在選舉中的投票行為可能會嚴重依賴於你對其他人投票的假設。如果沒有人投票給那位候選人，你的票將會浪費，但如果每個人都這麼認為，那麼該候選人根本就沒有機會。也許有很多人會說：“如果其他人也投票給他，我會投票給他。”

類似的情況可以發生在非常不同的情境中。你有沒有想過叫外賣，大家都說：“你不必因為我而點任何東西，但如果你點的話，我會想要一些薯條”？所有這些例子都可以是博弈論的應用，所以讓我們開始了解博弈論的內容。

理解遊戲

在玩之前，你需要了解遊戲的組成部分。照片來源：Laine Cooper，Unsplash

當你聽到“遊戲”這個詞時，你可能會想到像《Minecraft》這樣的電子遊戲，像《大富翁》這樣的桌上遊戲，或像撲克這樣的紙牌遊戲。所有這些遊戲都有一些共同的原則：我們總是有一些玩家可以根據遊戲規則做某些事情。例如，在撲克中，你可以加注、跟注或放棄。在《大富翁》中，你可以購買你停留的房產或不購買。我們還有一些關於如何贏得遊戲的概念。在撲克中，你需要得到最好的牌才能贏，而在《大富翁》中，你必須成為最後一個沒有破產的人。這也意味著在某些情況下，一些行動比其他行動更好。如果你手中有兩張A，那麼留在遊戲中比放棄更好。

當我們從博弈論的角度看待遊戲時，我們使用相同的概念，只是更加正式。

一個遊戲由一組玩家 I = {1, .., n} 組成，每個玩家都有一組策略 S 和一個效用函數 ui(s1, s2, … sn)。策略集是由遊戲規則決定的。例如，它可以是 S = {跟注、加注、放棄}，玩家必須決定要使用這些行動中的哪一個。效用函數 u（也稱為獎勵）描述了在其他玩家的行動下，某個玩家的特定行動的價值。每個玩家都希望最大化他們的效用，但現在來了棘手的部分：你的行動的效用依賴於其他玩家的行動。但對於他們來說，情況也是如此：他們的行動效用依賴於其他玩家的行動（包括你的行動）。

讓我們考慮一個眾所周知的遊戲來說明這一點。在剪刀石頭布中，我們有 n=2 的玩家，每個玩家可以選擇三個行動，因此每個玩家的策略集是 S={石頭、布、剪刀}。但一個行動的效用取決於另一個玩家的行動。如果對手選擇石頭，則布的效用很高（1），因為布贏過石頭。但如果你的對手選擇剪刀，則布的效用很低（-1），因為你會輸。最後，如果你的對手也選擇布，你們就平局，效用為0。

與其為每種情況單獨寫下效用函數，通常會將遊戲顯示在一個矩陣中，如下所示：

第一個玩家通過選擇他的行動來決定矩陣的行，而第二個玩家則通過選擇一個列來決定。例如，如果玩家1選擇布，而玩家2選擇剪刀，我們將進入第三列和第二行的單元格。這個單元格中的值是兩個玩家的效用，其中第一個值對應於玩家1，第二個值對應於玩家2。(-1,1)意味著玩家1的效用為-1，而玩家2的效用為1。剪刀贏過布。

囚徒困境

讓我們通過查看一些典型的遊戲來更熟悉博弈論的主要概念，這些遊戲通常是從可能發生在現實世界的故事或情境中衍生出來的，並要求人們在某些行動之間做出決定。這樣的故事可能是這樣的：

假設我們有兩名罪犯，他們被懷疑犯下了一宗罪行。警方有一些間接證據，但沒有實際的證據來證明他們的罪行。因此，他們質詢這兩名罪犯，現在他們必須決定是認罪還是否認罪行。如果你是其中一名罪犯，你可能會認為否認總是比認罪好，但現在來了棘手的部分：警方向你提出了一個交易。如果你認罪而你的同夥否認，你將被視為證人，並不會受到懲罰。在這種情況下，你可以自由離開，但你的同夥將入獄六年。聽起來是一個好交易，但要注意，結果也取決於你同夥的行動。如果你們都認罪，則不再有證人，你們都將入獄三年。如果你們都否認，警方只能對你們使用間接證據，這將導致你和你的同夥各入獄一年。但要注意，你的同夥也會得到相同的交易。如果你否認而他認罪，他就是證人，而你將入獄六年。你該如何決定？

從這個故事衍生出的遊戲稱為囚徒困境，是博弈論中的一個典型例子。我們可以像之前的剪刀石頭布一樣將其可視化為一個矩陣，在這個矩陣中，我們可以輕易看到玩家所面臨的困境。如果兩人都否認，他們將受到相對較輕的懲罰。但如果你假設你的同夥會否認，你可能會被誘惑去認罪，這樣就不會入獄。但你的同夥可能也會這麼想，如果你們都認罪，你們都會入獄更久。這樣的遊戲很容易讓你陷入困境。我們將在這個教學的下一章中討論解決這個問題的方法。首先，讓我們考慮一些其他例子。

巴赫與斯特拉文斯基

你和你的朋友想一起去聽音樂會。你是巴赫音樂的粉絲，但你的朋友則喜歡俄羅斯20世紀作曲家伊戈爾·斯特拉文斯基。然而，你們都想避免在任何音樂會上孤單。雖然你更喜歡巴赫而不是斯特拉文斯基，但你寧願和朋友一起去斯特拉文斯基的音樂會，也不願獨自去巴赫的音樂會。我們可以為這個遊戲創建一個矩陣：

你通過去巴赫或斯特拉文斯基的音樂會來決定行，朋友則通過去其中一場音樂會來決定列。對你來說，如果你們都選擇巴赫，那將是最好的。你的獎勵將是2，而你的朋友將得到1的獎勵，這對他來說仍然比獨自參加斯特拉文斯基的音樂會要好。然而，如果你們一起去斯特拉文斯基的音樂會，他會更高興。

你還記得我們說過玩家在做出決定之前不被允許溝通嗎？這個例子說明了為什麼。如果你們可以互相打電話並決定去哪裡，那麼這將不再是博弈論需要研究的遊戲。但你們不能打電話，所以你們只能去任何音樂會，並希望能在那裡遇到朋友。你會怎麼做？

武裝還是解除武裝？

第三個例子帶我們進入國際政治的領域。世界會因為更少的槍支而變得更快樂，不是嗎？然而，如果各國考慮解除武裝，他們也必須考慮其他國家的選擇。如果美國解除武裝，蘇聯可能會想要重新武裝，以便能夠攻擊美國——這是冷戰期間的思維。這樣的情況可以用以下矩陣來描述：

如你所見，當兩國都解除武裝時，他們獲得最高的獎勵（各3分），因為世界上槍支更少，戰爭的風險最小。然而，如果你解除武裝，而對手升級，則對手處於更有利的位置，獲得2分，而你只有0分。再者，升級自己可能會更好，這樣兩個玩家都能獲得1分。這比成為唯一解除武裝的人要好，但不如兩國都解除武裝的結果好。

解決方案？

所有這些例子有一個共同點：沒有一個選項總是最好。相反，某個行動對一個玩家的效用總是依賴於另一個玩家的行動，而後者的行動又依賴於第一個玩家的行動，依此類推。博弈論現在關心的是尋找最佳解決方案，決定什麼是理性的行動；也就是說，最大化預期獎勵的行動。對於這樣的解決方案的不同想法將是這個系列下一章的內容。

總結

學習博弈論和玩遊戲一樣有趣，你不覺得嗎？照片來源：Christopher Paul High，Unsplash

在繼續尋找解決方案的下一章之前，讓我們回顧一下到目前為止學到的內容。

一個遊戲由玩家組成，玩家決定行動，這些行動具有效用或獎勵。

行動的效用/獎勵依賴於其他玩家的行動。

在靜態遊戲中，玩家同時決定行動。在動態遊戲中，他們輪流決定。

囚徒困境是博弈論中一個非常受歡迎的遊戲例子。

當沒有單一的行動比其他行動更好時，遊戲變得更加有趣。

現在你已經熟悉了博弈論中遊戲的描述方式，你可以查看下一章，學習如何為博弈論中的遊戲找到解決方案。

參考資料

這裡介紹的主題通常在博弈論的標準教科書中涵蓋。我主要使用了這本雖然是德文的書：

Bartholomae, F., & Wiens, M. (2016). Spieltheorie. Ein anwendungsorientiertes Lehrbuch. Wiesbaden: Springer Fachmedien Wiesbaden.

另一個英文的選擇可能是這本：

Espinola-Arredondo, A., & Muñoz-Garcia, F. (2023). Game Theory: An Introduction with Step-by-step Examples. Springer Nature.

博弈論是一個相對年輕的研究領域，第一本主要的教科書是這本：

Von Neumann, J., & Morgenstern, O. (1944). Theory of games and economic behavior.

喜歡這篇文章嗎？關注我，以便獲得我未來文章的通知。

新聞來源

本文由 AI 台灣 運用 AI 技術編撰，內容僅供參考，請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團，
隨時掌握最新 AI 動態與實用資訊！

談論遊戲 | 走向數據科學

1X打造最新人形機器人NEO Gamma，更適合融入家庭

DOGE 的 USDS 清理包括了保護退伍軍人數據安全的那個人

Related Posts

中國教育改革人工智慧助力創新人才培育

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破

2027 年 AI 預測人類水平 AI 的全新里程碑

全球AI教育市場蓬勃發展智慧學習工具引領新趨勢

AI 技術對人類智能的影響我們在失去什麼？

MIT 研發新技術提升 AI 生成代碼準確性助力非專業人士掌握 SQL 語言

DOGE 的 USDS 清理包括了保護退伍軍人數據安全的那個人

研究：即使學會了正確的想法，人類和動物仍似乎會測試其他方法 | MIT新聞

發佈留言取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

談論遊戲 | 走向數據科學

博弈論的應用

理解遊戲

更多細節

囚徒困境

巴赫與斯特拉文斯基

武裝還是解除武裝？

解決方案？

總結

參考資料

1X打造最新人形機器人NEO Gamma，更適合融入家庭

DOGE 的 USDS 清理包括了保護退伍軍人數據安全的那個人

Related Posts

發佈留言 取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

發佈留言取消回覆