星期日, 15 6 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home AI 綜合新聞

談論遊戲 | 走向數據科學

2025-02-22
in AI 綜合新聞
0 0
0
談論遊戲 | 走向數據科學
Share on FacebookShare on Twitter
Your Ad


博弈論是一個在經濟學中非常重要的研究領域,但在其他科學領域卻不太受歡迎。然而,博弈論中的概念對更廣泛的觀眾也有趣,包括數據科學家、統計學家、計算機科學家或心理學家等。這篇文章是博弈論基礎的四章教學系列的開篇,敬請期待接下來的文章。

在這篇文章中,我將解釋博弈論所處理的問題類型,並介紹描述博弈的主要術語和概念。我們將看到一些通常在博弈論中分析的遊戲範例,並為後續章節深入了解博弈論的能力奠定基礎。但在深入細節之前,我想先介紹一些博弈論的應用,這些應用展示了博弈論概念可以應用的多種領域。

博弈論的應用

甚至薯條也可以是博弈論的應用。照片來源:engin akyurt,Unsplash

在選舉中,投票給一個小黨有意義嗎?如果這個黨可能根本沒有勝算?與提供相同商品的競爭對手展開價格戰值得嗎?如果你減少了過度捕撈區域的捕獲率,但你的競爭對手仍然照常捕魚,你會獲得什麼好處?如果你相信政府會在下一次颶風後支付重建費用,那麼你還需要投保嗎?在下一次拍賣中,當你準備出價購買你最喜歡的畢卡索畫作時,你應該怎麼做?

所有這些問題(還有很多其他問題)都屬於可以用博弈論建模的應用範疇。每當一個情況涉及與他人的互動和策略決策時,就可以應用博弈論的概念來正式描述這種情況,並尋找那些不是直覺上做出的決策,而是基於理性概念的決策。上述所有情況的關鍵在於,你的決策依賴於其他人的行為。如果每個人都同意保護過度捕撈的區域,你會想要一起參與以保護自然,但如果你認為其他人會繼續捕魚,那麼你為什麼要成為唯一停止的人呢?同樣,你在選舉中的投票行為可能會嚴重依賴於你對其他人投票的假設。如果沒有人投票給那位候選人,你的票將會浪費,但如果每個人都這麼認為,那麼該候選人根本就沒有機會。也許有很多人會說:“如果其他人也投票給他,我會投票給他。”

類似的情況可以發生在非常不同的情境中。你有沒有想過叫外賣,大家都說:“你不必因為我而點任何東西,但如果你點的話,我會想要一些薯條”?所有這些例子都可以是博弈論的應用,所以讓我們開始了解博弈論的內容。

理解遊戲

在玩之前,你需要了解遊戲的組成部分。照片來源:Laine Cooper,Unsplash

當你聽到“遊戲”這個詞時,你可能會想到像《Minecraft》這樣的電子遊戲,像《大富翁》這樣的桌上遊戲,或像撲克這樣的紙牌遊戲。所有這些遊戲都有一些共同的原則:我們總是有一些玩家可以根據遊戲規則做某些事情。例如,在撲克中,你可以加注、跟注或放棄。在《大富翁》中,你可以購買你停留的房產或不購買。我們還有一些關於如何贏得遊戲的概念。在撲克中,你需要得到最好的牌才能贏,而在《大富翁》中,你必須成為最後一個沒有破產的人。這也意味著在某些情況下,一些行動比其他行動更好。如果你手中有兩張A,那麼留在遊戲中比放棄更好。

當我們從博弈論的角度看待遊戲時,我們使用相同的概念,只是更加正式。

博弈論中的遊戲由n個玩家組成,每個玩家都有一組策略和一個效用函數。

一個遊戲由一組玩家 I = {1, .., n} 組成,每個玩家都有一組策略 S 和一個效用函數 ui(s1, s2, … sn)。策略集是由遊戲規則決定的。例如,它可以是 S = {跟注、加注、放棄},玩家必須決定要使用這些行動中的哪一個。效用函數 u(也稱為獎勵)描述了在其他玩家的行動下,某個玩家的特定行動的價值。每個玩家都希望最大化他們的效用,但現在來了棘手的部分:你的行動的效用依賴於其他玩家的行動。但對於他們來說,情況也是如此:他們的行動效用依賴於其他玩家的行動(包括你的行動)。

讓我們考慮一個眾所周知的遊戲來說明這一點。在剪刀石頭布中,我們有 n=2 的玩家,每個玩家可以選擇三個行動,因此每個玩家的策略集是 S={石頭、布、剪刀}。但一個行動的效用取決於另一個玩家的行動。如果對手選擇石頭,則布的效用很高(1),因為布贏過石頭。但如果你的對手選擇剪刀,則布的效用很低(-1),因為你會輸。最後,如果你的對手也選擇布,你們就平局,效用為0。

玩家一選擇布時,對手策略的三種選擇的效用值。

與其為每種情況單獨寫下效用函數,通常會將遊戲顯示在一個矩陣中,如下所示:

第一個玩家通過選擇他的行動來決定矩陣的行,而第二個玩家則通過選擇一個列來決定。例如,如果玩家1選擇布,而玩家2選擇剪刀,我們將進入第三列和第二行的單元格。這個單元格中的值是兩個玩家的效用,其中第一個值對應於玩家1,第二個值對應於玩家2。(-1,1)意味著玩家1的效用為-1,而玩家2的效用為1。剪刀贏過布。

更多細節

現在我們已經理解了博弈論中遊戲的主要組成部分。讓我再補充一些關於博弈論的提示,以及它用來描述情境的假設。

我們通常假設玩家同時選擇他們的行動(就像在剪刀石頭布中)。我們稱這種遊戲為靜態遊戲。還有動態遊戲,玩家輪流決定他們的行動(就像在國際象棋中)。我們會在這個教學的後續章節中考慮這些情況。

在博弈論中,通常假設玩家之間不能相互溝通,因此他們在決定行動之前無法達成協議。在剪刀石頭布中,你不會想這樣做,但還有其他遊戲,在這種情況下,溝通會使選擇行動變得更容易。然而,我們將始終假設無法溝通。

博弈論被認為是一種規範理論,而不是描述性理論。這意味著我們將分析遊戲,關注“理性解決方案會是什麼?”這可能並不總是人們在現實中類似情況下所做的事情。對於現實人類行為的描述是行為經濟學的研究領域的一部分,這個領域位於心理學和經濟學的交界處。

囚徒困境

囚徒困境就是不想落入這種情況。照片來源:De an Sun,Unsplash

讓我們通過查看一些典型的遊戲來更熟悉博弈論的主要概念,這些遊戲通常是從可能發生在現實世界的故事或情境中衍生出來的,並要求人們在某些行動之間做出決定。這樣的故事可能是這樣的:

假設我們有兩名罪犯,他們被懷疑犯下了一宗罪行。警方有一些間接證據,但沒有實際的證據來證明他們的罪行。因此,他們質詢這兩名罪犯,現在他們必須決定是認罪還是否認罪行。如果你是其中一名罪犯,你可能會認為否認總是比認罪好,但現在來了棘手的部分:警方向你提出了一個交易。如果你認罪而你的同夥否認,你將被視為證人,並不會受到懲罰。在這種情況下,你可以自由離開,但你的同夥將入獄六年。聽起來是一個好交易,但要注意,結果也取決於你同夥的行動。如果你們都認罪,則不再有證人,你們都將入獄三年。如果你們都否認,警方只能對你們使用間接證據,這將導致你和你的同夥各入獄一年。但要注意,你的同夥也會得到相同的交易。如果你否認而他認罪,他就是證人,而你將入獄六年。你該如何決定?

囚徒困境。

從這個故事衍生出的遊戲稱為囚徒困境,是博弈論中的一個典型例子。我們可以像之前的剪刀石頭布一樣將其可視化為一個矩陣,在這個矩陣中,我們可以輕易看到玩家所面臨的困境。如果兩人都否認,他們將受到相對較輕的懲罰。但如果你假設你的同夥會否認,你可能會被誘惑去認罪,這樣就不會入獄。但你的同夥可能也會這麼想,如果你們都認罪,你們都會入獄更久。這樣的遊戲很容易讓你陷入困境。我們將在這個教學的下一章中討論解決這個問題的方法。首先,讓我們考慮一些其他例子。

巴赫與斯特拉文斯基

你更喜歡誰,巴赫還是斯特拉文斯基?照片來源:Sigmund,Unsplash

你和你的朋友想一起去聽音樂會。你是巴赫音樂的粉絲,但你的朋友則喜歡俄羅斯20世紀作曲家伊戈爾·斯特拉文斯基。然而,你們都想避免在任何音樂會上孤單。雖然你更喜歡巴赫而不是斯特拉文斯基,但你寧願和朋友一起去斯特拉文斯基的音樂會,也不願獨自去巴赫的音樂會。我們可以為這個遊戲創建一個矩陣:

巴赫與斯特拉文斯基

你通過去巴赫或斯特拉文斯基的音樂會來決定行,朋友則通過去其中一場音樂會來決定列。對你來說,如果你們都選擇巴赫,那將是最好的。你的獎勵將是2,而你的朋友將得到1的獎勵,這對他來說仍然比獨自參加斯特拉文斯基的音樂會要好。然而,如果你們一起去斯特拉文斯基的音樂會,他會更高興。

你還記得我們說過玩家在做出決定之前不被允許溝通嗎?這個例子說明了為什麼。如果你們可以互相打電話並決定去哪裡,那麼這將不再是博弈論需要研究的遊戲。但你們不能打電話,所以你們只能去任何音樂會,並希望能在那裡遇到朋友。你會怎麼做?

武裝還是解除武裝?

讓愛取代戰爭。照片來源:Artem Beliaikin,Unsplash

第三個例子帶我們進入國際政治的領域。世界會因為更少的槍支而變得更快樂,不是嗎?然而,如果各國考慮解除武裝,他們也必須考慮其他國家的選擇。如果美國解除武裝,蘇聯可能會想要重新武裝,以便能夠攻擊美國——這是冷戰期間的思維。這樣的情況可以用以下矩陣來描述:

解除武裝與升級遊戲的矩陣。

如你所見,當兩國都解除武裝時,他們獲得最高的獎勵(各3分),因為世界上槍支更少,戰爭的風險最小。然而,如果你解除武裝,而對手升級,則對手處於更有利的位置,獲得2分,而你只有0分。再者,升級自己可能會更好,這樣兩個玩家都能獲得1分。這比成為唯一解除武裝的人要好,但不如兩國都解除武裝的結果好。

解決方案?

所有這些例子有一個共同點:沒有一個選項總是最好。相反,某個行動對一個玩家的效用總是依賴於另一個玩家的行動,而後者的行動又依賴於第一個玩家的行動,依此類推。博弈論現在關心的是尋找最佳解決方案,決定什麼是理性的行動;也就是說,最大化預期獎勵的行動。對於這樣的解決方案的不同想法將是這個系列下一章的內容。

總結

學習博弈論和玩遊戲一樣有趣,你不覺得嗎?照片來源:Christopher Paul High,Unsplash

在繼續尋找解決方案的下一章之前,讓我們回顧一下到目前為止學到的內容。

  • 一個遊戲由玩家組成,玩家決定行動,這些行動具有效用或獎勵。
  • 行動的效用/獎勵依賴於其他玩家的行動。
  • 在靜態遊戲中,玩家同時決定行動。在動態遊戲中,他們輪流決定。
  • 囚徒困境是博弈論中一個非常受歡迎的遊戲例子。
  • 當沒有單一的行動比其他行動更好時,遊戲變得更加有趣。

現在你已經熟悉了博弈論中遊戲的描述方式,你可以查看下一章,學習如何為博弈論中的遊戲找到解決方案。

參考資料

這裡介紹的主題通常在博弈論的標準教科書中涵蓋。我主要使用了這本雖然是德文的書:

Bartholomae, F., & Wiens, M. (2016). Spieltheorie. Ein anwendungsorientiertes Lehrbuch. Wiesbaden: Springer Fachmedien Wiesbaden.

另一個英文的選擇可能是這本:

Espinola-Arredondo, A., & Muñoz-Garcia, F. (2023). Game Theory: An Introduction with Step-by-step Examples. Springer Nature.

博弈論是一個相對年輕的研究領域,第一本主要的教科書是這本:

Von Neumann, J., & Morgenstern, O. (1944). Theory of games and economic behavior.

喜歡這篇文章嗎?關注我,以便獲得我未來文章的通知。



新聞來源

本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!

Tags: Deep DivesEconomicsGame TheoryPsychologyStatistics談論遊戲走向數據科學
Previous Post

1X打造最新人形機器人NEO Gamma,更適合融入家庭

Next Post

DOGE 的 USDS 清理包括了保護退伍軍人數據安全的那個人

Related Posts

中國教育改革人工智慧助力創新人才培育
AI 綜合新聞

中國教育改革人工智慧助力創新人才培育

2025-06-11
AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破
AI 綜合新聞

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破

2025-04-24
2027 年 AI 預測人類水平 AI 的全新里程碑
AI 綜合新聞

2027 年 AI 預測人類水平 AI 的全新里程碑

2025-04-21
全球AI教育市場蓬勃發展智慧學習工具引領新趨勢
AI 綜合新聞

全球AI教育市場蓬勃發展智慧學習工具引領新趨勢

2025-04-21
AI 技術對人類智能的影響我們在失去什麼?
AI 綜合新聞

AI 技術對人類智能的影響我們在失去什麼?

2025-04-20
MIT 研發新技術提升 AI 生成代碼準確性助力非專業人士掌握 SQL 語言
AI 綜合新聞

MIT 研發新技術提升 AI 生成代碼準確性助力非專業人士掌握 SQL 語言

2025-04-18
Next Post
DOGE 的 USDS 清理包括了保護退伍軍人數據安全的那個人

DOGE 的 USDS 清理包括了保護退伍軍人數據安全的那個人

研究:即使學會了正確的想法,人類和動物仍似乎會測試其他方法 | MIT新聞

研究:即使學會了正確的想法,人類和動物仍似乎會測試其他方法 | MIT新聞

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 6 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。