介紹
「錢買不到快樂。」 「不能只看封面來評價一本書。」 「一天一蘋果,醫生遠離我。」
你可能聽過這些話很多次,但當我們查看數據時,它們真的成立嗎?在這篇文章中,我想把一些流行的迷思或說法拿來用真實數據來檢驗。
我們可能會確認一些意想不到的真相,或是揭穿一些流行的信念。希望無論哪種情況,我們都能對周圍的世界有新的見解。
假設
「一天一蘋果,醫生遠離我」:有沒有真實的證據支持這個說法呢?
如果這個迷思是真的,我們應該會發現每人蘋果消費量與每人看醫生次數之間有負相關。也就是說,一個國家消耗的蘋果越多,人們需要看醫生的次數就應該越少。
讓我們來看看數據,看看實際的數字是怎麼說的。
檢驗蘋果消費與看醫生次數的關係
我們先從每人蘋果消費量與每人看醫生次數之間的簡單相關性檢查開始。
數據來源
數據來自:
由於數據的可用性隨年份而異,我們選擇了2017年,因為它提供了最多國家的完整數據。然而,其他年份的結果也是一致的。

視覺化關係
為了視覺化較高的蘋果消費是否與較少的看醫生次數有關,我們開始查看帶有回歸線的散點圖。

回歸圖顯示出非常微弱的負相關,這意味著在那些吃蘋果較多的國家,人們的看醫生次數有輕微的下降趨勢。不幸的是,這個趨勢太弱,無法被視為有意義。
OLS回歸
為了統計上檢驗這種關係,我們進行線性回歸(OLS),其中每人看醫生次數是依賴變量,而每人蘋果消費量是獨立變量。

結果確認了散點圖的暗示:
- 蘋果消費的係數為-0.0107,這意味著即使有影響,影響也非常小。
- p值為0.860(86%),遠高於標準顯著性閾值5%。
- R²值幾乎為零,這意味著蘋果消費幾乎無法解釋看醫生次數的變化。
這並不意味著沒有關係,而是我們無法用可用的數據來證明。如果有任何真實的影響可能太小而無法檢測,或者我們未包含的其他因素起了更大的作用,或者數據根本無法很好地反映這種關係。
控制混淆變量
我們完成了嗎?還不算。我們到目前為止只檢查了蘋果消費與看醫生次數之間的直接關係。
如前所述,許多其他因素可能影響這兩個變量,可能隱藏了真實的關係或創造了一個虛假的關係。
如果我們考慮這個因果圖:

我們假設蘋果消費直接影響看醫生次數。然而,其他隱藏的因素可能在起作用。如果我們不考慮這些因素,我們可能會錯過檢測到真實關係的機會。
一個著名的例子來自Messerli(2012)的研究,該研究發現每人巧克力消費量與諾貝爾獎得獎者人數之間存在有趣的相關性。
那麼,開始大量吃巧克力會幫助我們贏得諾貝爾獎嗎?可能不會。可能的解釋是人均GDP是一個混淆變量。這意味著較富裕的國家往往有更高的巧克力消費和更多的諾貝爾獎得主。觀察到的關係並不是因果的,而是由於一個隱藏的(混淆)因素。
在我們的情況中也可能發生同樣的事情。可能有混淆變量影響蘋果消費和看醫生次數,使得如果存在真實關係就難以看出。
需要考慮的兩個關鍵混淆變量是人均GDP和中位年齡。較富裕的國家擁有更好的醫療系統和不同的飲食模式,而年長的人口往往更頻繁地看醫生,並可能有不同的飲食習慣。
為了控制這些因素,我們改變模型,引入這些混淆變量:

數據來源
數據來自:


OLS回歸(考慮混淆變量)
在控制了人均GDP和中位年齡後,我們進行多元回歸以測試蘋果消費是否對看醫生次數有任何有意義的影響。

結果確認了我們之前的觀察:
- 蘋果消費的係數仍然非常小(-0.0100),這意味著任何潛在的影響都是微不足道的。
- p值(85.5%)仍然極高,遠離統計顯著性。
- 我們仍然無法拒絕虛無假設,這意味著我們沒有強有力的證據支持吃更多蘋果會導致看醫生次數減少的觀點。
和之前一樣,這並不一定意味著不存在關係,而是我們無法用可用的數據來證明。仍然有可能真實的影響太小而無法檢測,或者還有其他我們未包含的因素。
不過,有一個有趣的觀察是,人均GDP與看醫生次數之間也沒有顯著的關係,因為其p值為0.668(66.8%),這表明我們無法在數據中找到財富解釋醫療使用變化的證據。
另一方面,中位年齡似乎與看醫生次數有很強的關聯,p值為0.001(0.1%)和正係數(0.4952)。這表明年長的人口往往更頻繁地看醫生,這其實並不令人驚訝!
因此,雖然我們沒有找到支持蘋果迷思的證據,但數據確實揭示了年齡與醫療使用之間的有趣關係。
中位年齡 → 看醫生次數
OLS回歸的結果顯示中位年齡與看醫生次數之間存在強關係,下面的視覺化確認了這一趨勢。

有一個明顯的上升趨勢,表明年齡較大的國家每人看醫生的次數較多。
由於我們在這裡只考察中位年齡和看醫生次數,有人可能會認為人均GDP可能是一個混淆變量,影響兩者。然而,之前的OLS回歸顯示即使在模型中包含GDP,這種關係仍然強且統計上顯著。
這表明中位年齡是解釋各國看醫生次數差異的關鍵因素,與GDP無關。
GDP → 蘋果消費
雖然與看醫生次數沒有直接關係,但在查看人均GDP與蘋果消費之間的關係時,出現了一個有趣的次要發現。
一個可能的解釋是,較富裕的國家對新鮮產品的獲取更好。另一個可能性是氣候和地理位置起了作用,因此許多高GDP國家位於蘋果生產強勁的地區,使蘋果更容易獲得且價格合理。
當然,還有其他因素可能影響這種關係,但我們不會在這裡深入探討。

散點圖顯示出正相關:隨著人均GDP的增加,蘋果消費也傾向於上升。然而,與中位年齡和看醫生次數相比,這一趨勢較弱,數據變化較大。

OLS確認了這種關係:人均GDP的係數為0.2257,這意味著每增加1,000美元的人均GDP,蘋果消費量預計增加約0.23公斤。
3.8%的p值使我們能夠拒絕虛無假設。因此,這種關係在統計上是顯著的。然而,R²值(0.145)相對較低,這意味著雖然GDP解釋了一些蘋果消費的變化,但還有許多其他因素可能也在起作用。
結論
這句話說:
「一天一蘋果,醫生遠離我。」
但在用真實數據檢驗這個迷思後,結果似乎與這句話不符。在多個年份中,結果是一致的:蘋果消費與看醫生次數之間並沒有出現有意義的關係,即使在控制了混淆變量後。看來光靠蘋果是不夠的,無法讓醫生遠離。
然而,這並不完全否定吃更多蘋果可能減少看醫生次數的想法。觀察數據,無論我們如何控制混淆變量,都無法完全證明或否定因果關係。
要獲得更統計準確的答案,並排除所有可能的混淆變量,我們需要進行A/B測試。在這樣的實驗中,參與者將隨機分為兩組,例如一組每天吃固定量的蘋果,另一組則避免吃蘋果。通過比較這兩組在一段時間內的看醫生次數,我們可以確定它們之間是否存在差異,從而提供更強的因果影響證據。
出於明顯的原因,我選擇不走這條路。雇用一堆參與者會很昂貴,並且在倫理上強迫人們為了科學而避免吃蘋果確實是有問題的。
不過,我們確實發現了一些有趣的模式。看醫生次數的最強預測因子不是蘋果消費,而是中位年齡:一個國家的人口越老,人們看醫生的頻率就越高。
同時,人均GDP與蘋果消費之間顯示出輕微的聯繫,這可能是因為較富裕的國家對新鮮農產品的獲取更好,或者因為蘋果生產地區往往更發達。
因此,雖然我們無法確認原始的迷思,但我們可以提供一個不那麼詩意,但有數據支持的版本:
「年輕的年齡讓醫生遠離。」
如果你喜歡這個分析並想聯繫我,可以在LinkedIn上找到我。
完整的分析可以在這個GitHub筆記本中找到。
數據來源
水果消費:聯合國糧食及農業組織(2023)——經過我們的世界數據主要處理。「蘋果的人均消費量——FAO」[數據集]。聯合國糧食及農業組織,「食品平衡:食品平衡(-2013,舊方法論和人口)」;聯合國糧食及農業組織,「食品平衡:食品平衡(2010-)」[原始數據]。根據CC BY 4.0授權。
看醫生次數:經濟合作與發展組織(OECD)(2024),諮詢,網址(於2025年1月22日訪問)。根據CC BY 4.0授權。
人均GDP:世界銀行(2025)——經過我們的世界數據小幅處理。「人均GDP——世界銀行——以2021年國際美元計算」[數據集]。世界銀行,「世界銀行世界發展指標」[原始數據]。於2025年1月31日從https://ourworldindata.org/grapher/gdp-per-capita-worldbank檢索。根據CC BY 4.0授權。
中位年齡:聯合國,世界人口展望(2024)——經過我們的世界數據處理。「中位年齡,中等預測——聯合國WPP」[數據集]。聯合國,「世界人口展望」[原始數據]。根據CC BY 4.0授權。
所有圖片,除非另有說明,均由作者提供。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!