博弈論是一個在經濟學中非常重要的研究領域,但在其他科學領域卻不太受歡迎。然而,博弈論中的概念對更廣泛的觀眾也有趣,包括數據科學家、統計學家、計算機科學家或心理學家等。這篇文章是博弈論基礎的四章教學系列的開篇,敬請期待接下來的文章。
在這篇文章中,我將解釋博弈論所處理的問題類型,並介紹描述博弈的主要術語和概念。我們將看到一些通常在博弈論中分析的遊戲範例,並為後續章節深入了解博弈論的能力奠定基礎。但在深入細節之前,我想先介紹一些博弈論的應用,這些應用展示了博弈論概念可以應用的多種領域。
博弈論的應用
在選舉中,投票給一個小黨有意義嗎?如果這個黨可能根本沒有勝算?與提供相同商品的競爭對手展開價格戰值得嗎?如果你減少了過度捕撈區域的捕獲率,但你的競爭對手仍然照常捕魚,你會獲得什麼好處?如果你相信政府會在下一次颶風後支付重建費用,那麼你還需要投保嗎?在下一次拍賣中,當你準備出價購買你最喜歡的畢卡索畫作時,你應該怎麼做?
所有這些問題(還有很多其他問題)都屬於可以用博弈論建模的應用範疇。每當一個情況涉及與他人的互動和策略決策時,就可以應用博弈論的概念來正式描述這種情況,並尋找那些不是直覺上做出的決策,而是基於理性概念的決策。上述所有情況的關鍵在於,你的決策依賴於其他人的行為。如果每個人都同意保護過度捕撈的區域,你會想要一起參與以保護自然,但如果你認為其他人會繼續捕魚,那麼你為什麼要成為唯一停止的人呢?同樣,你在選舉中的投票行為可能會嚴重依賴於你對其他人投票的假設。如果沒有人投票給那位候選人,你的票將會浪費,但如果每個人都這麼認為,那麼該候選人根本就沒有機會。也許有很多人會說:“如果其他人也投票給他,我會投票給他。”
類似的情況可以發生在非常不同的情境中。你有沒有想過叫外賣,大家都說:“你不必因為我而點任何東西,但如果你點的話,我會想要一些薯條”?所有這些例子都可以是博弈論的應用,所以讓我們開始了解博弈論的內容。
理解遊戲

當你聽到“遊戲”這個詞時,你可能會想到像《Minecraft》這樣的電子遊戲,像《大富翁》這樣的桌上遊戲,或像撲克這樣的紙牌遊戲。所有這些遊戲都有一些共同的原則:我們總是有一些玩家可以根據遊戲規則做某些事情。例如,在撲克中,你可以加注、跟注或放棄。在《大富翁》中,你可以購買你停留的房產或不購買。我們還有一些關於如何贏得遊戲的概念。在撲克中,你需要得到最好的牌才能贏,而在《大富翁》中,你必須成為最後一個沒有破產的人。這也意味著在某些情況下,一些行動比其他行動更好。如果你手中有兩張A,那麼留在遊戲中比放棄更好。
當我們從博弈論的角度看待遊戲時,我們使用相同的概念,只是更加正式。

一個遊戲由一組玩家 I = {1, .., n} 組成,每個玩家都有一組策略 S 和一個效用函數 ui(s1, s2, … sn)。策略集是由遊戲規則決定的。例如,它可以是 S = {跟注、加注、放棄},玩家必須決定要使用這些行動中的哪一個。效用函數 u(也稱為獎勵)描述了在其他玩家的行動下,某個玩家的特定行動的價值。每個玩家都希望最大化他們的效用,但現在來了棘手的部分:你的行動的效用依賴於其他玩家的行動。但對於他們來說,情況也是如此:他們的行動效用依賴於其他玩家的行動(包括你的行動)。
讓我們考慮一個眾所周知的遊戲來說明這一點。在剪刀石頭布中,我們有 n=2 的玩家,每個玩家可以選擇三個行動,因此每個玩家的策略集是 S={石頭、布、剪刀}。但一個行動的效用取決於另一個玩家的行動。如果對手選擇石頭,則布的效用很高(1),因為布贏過石頭。但如果你的對手選擇剪刀,則布的效用很低(-1),因為你會輸。最後,如果你的對手也選擇布,你們就平局,效用為0。

與其為每種情況單獨寫下效用函數,通常會將遊戲顯示在一個矩陣中,如下所示:

第一個玩家通過選擇他的行動來決定矩陣的行,而第二個玩家則通過選擇一個列來決定。例如,如果玩家1選擇布,而玩家2選擇剪刀,我們將進入第三列和第二行的單元格。這個單元格中的值是兩個玩家的效用,其中第一個值對應於玩家1,第二個值對應於玩家2。(-1,1)意味著玩家1的效用為-1,而玩家2的效用為1。剪刀贏過布。
更多細節
現在我們已經理解了博弈論中遊戲的主要組成部分。讓我再補充一些關於博弈論的提示,以及它用來描述情境的假設。
我們通常假設玩家同時選擇他們的行動(就像在剪刀石頭布中)。我們稱這種遊戲為靜態遊戲。還有動態遊戲,玩家輪流決定他們的行動(就像在國際象棋中)。我們會在這個教學的後續章節中考慮這些情況。
在博弈論中,通常假設玩家之間不能相互溝通,因此他們在決定行動之前無法達成協議。在剪刀石頭布中,你不會想這樣做,但還有其他遊戲,在這種情況下,溝通會使選擇行動變得更容易。然而,我們將始終假設無法溝通。
博弈論被認為是一種規範理論,而不是描述性理論。這意味著我們將分析遊戲,關注“理性解決方案會是什麼?”這可能並不總是人們在現實中類似情況下所做的事情。對於現實人類行為的描述是行為經濟學的研究領域的一部分,這個領域位於心理學和經濟學的交界處。
囚徒困境

讓我們通過查看一些典型的遊戲來更熟悉博弈論的主要概念,這些遊戲通常是從可能發生在現實世界的故事或情境中衍生出來的,並要求人們在某些行動之間做出決定。這樣的故事可能是這樣的:
假設我們有兩名罪犯,他們被懷疑犯下了一宗罪行。警方有一些間接證據,但沒有實際的證據來證明他們的罪行。因此,他們質詢這兩名罪犯,現在他們必須決定是認罪還是否認罪行。如果你是其中一名罪犯,你可能會認為否認總是比認罪好,但現在來了棘手的部分:警方向你提出了一個交易。如果你認罪而你的同夥否認,你將被視為證人,並不會受到懲罰。在這種情況下,你可以自由離開,但你的同夥將入獄六年。聽起來是一個好交易,但要注意,結果也取決於你同夥的行動。如果你們都認罪,則不再有證人,你們都將入獄三年。如果你們都否認,警方只能對你們使用間接證據,這將導致你和你的同夥各入獄一年。但要注意,你的同夥也會得到相同的交易。如果你否認而他認罪,他就是證人,而你將入獄六年。你該如何決定?

從這個故事衍生出的遊戲稱為囚徒困境,是博弈論中的一個典型例子。我們可以像之前的剪刀石頭布一樣將其可視化為一個矩陣,在這個矩陣中,我們可以輕易看到玩家所面臨的困境。如果兩人都否認,他們將受到相對較輕的懲罰。但如果你假設你的同夥會否認,你可能會被誘惑去認罪,這樣就不會入獄。但你的同夥可能也會這麼想,如果你們都認罪,你們都會入獄更久。這樣的遊戲很容易讓你陷入困境。我們將在這個教學的下一章中討論解決這個問題的方法。首先,讓我們考慮一些其他例子。
巴赫與斯特拉文斯基

你和你的朋友想一起去聽音樂會。你是巴赫音樂的粉絲,但你的朋友則喜歡俄羅斯20世紀作曲家伊戈爾·斯特拉文斯基。然而,你們都想避免在任何音樂會上孤單。雖然你更喜歡巴赫而不是斯特拉文斯基,但你寧願和朋友一起去斯特拉文斯基的音樂會,也不願獨自去巴赫的音樂會。我們可以為這個遊戲創建一個矩陣:

你通過去巴赫或斯特拉文斯基的音樂會來決定行,朋友則通過去其中一場音樂會來決定列。對你來說,如果你們都選擇巴赫,那將是最好的。你的獎勵將是2,而你的朋友將得到1的獎勵,這對他來說仍然比獨自參加斯特拉文斯基的音樂會要好。然而,如果你們一起去斯特拉文斯基的音樂會,他會更高興。
你還記得我們說過玩家在做出決定之前不被允許溝通嗎?這個例子說明了為什麼。如果你們可以互相打電話並決定去哪裡,那麼這將不再是博弈論需要研究的遊戲。但你們不能打電話,所以你們只能去任何音樂會,並希望能在那裡遇到朋友。你會怎麼做?
武裝還是解除武裝?

第三個例子帶我們進入國際政治的領域。世界會因為更少的槍支而變得更快樂,不是嗎?然而,如果各國考慮解除武裝,他們也必須考慮其他國家的選擇。如果美國解除武裝,蘇聯可能會想要重新武裝,以便能夠攻擊美國——這是冷戰期間的思維。這樣的情況可以用以下矩陣來描述:

如你所見,當兩國都解除武裝時,他們獲得最高的獎勵(各3分),因為世界上槍支更少,戰爭的風險最小。然而,如果你解除武裝,而對手升級,則對手處於更有利的位置,獲得2分,而你只有0分。再者,升級自己可能會更好,這樣兩個玩家都能獲得1分。這比成為唯一解除武裝的人要好,但不如兩國都解除武裝的結果好。
解決方案?
所有這些例子有一個共同點:沒有一個選項總是最好。相反,某個行動對一個玩家的效用總是依賴於另一個玩家的行動,而後者的行動又依賴於第一個玩家的行動,依此類推。博弈論現在關心的是尋找最佳解決方案,決定什麼是理性的行動;也就是說,最大化預期獎勵的行動。對於這樣的解決方案的不同想法將是這個系列下一章的內容。
總結

在繼續尋找解決方案的下一章之前,讓我們回顧一下到目前為止學到的內容。
- 一個遊戲由玩家組成,玩家決定行動,這些行動具有效用或獎勵。
- 行動的效用/獎勵依賴於其他玩家的行動。
- 在靜態遊戲中,玩家同時決定行動。在動態遊戲中,他們輪流決定。
- 囚徒困境是博弈論中一個非常受歡迎的遊戲例子。
- 當沒有單一的行動比其他行動更好時,遊戲變得更加有趣。
現在你已經熟悉了博弈論中遊戲的描述方式,你可以查看下一章,學習如何為博弈論中的遊戲找到解決方案。
參考資料
這裡介紹的主題通常在博弈論的標準教科書中涵蓋。我主要使用了這本雖然是德文的書:
Bartholomae, F., & Wiens, M. (2016). Spieltheorie. Ein anwendungsorientiertes Lehrbuch. Wiesbaden: Springer Fachmedien Wiesbaden.
另一個英文的選擇可能是這本:
Espinola-Arredondo, A., & Muñoz-Garcia, F. (2023). Game Theory: An Introduction with Step-by-step Examples. Springer Nature.
博弈論是一個相對年輕的研究領域,第一本主要的教科書是這本:
Von Neumann, J., & Morgenstern, O. (1944). Theory of games and economic behavior.
喜歡這篇文章嗎?關注我,以便獲得我未來文章的通知。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!