1. 介紹
1.1 背景與動機
巧克力在全世界都受到喜愛。從古代在亞馬遜流域採收有機可可的做法,到瑞士山區的巧克力師傅雕刻可食用的藝術品,再到美國賓夕法尼亞州的赫希工廠每天生產七千萬顆巧克力豆,巧克力的多樣形式和風味已融入許多文化及其習俗中。雖然巧克力產品的品質差異很大,但一種知名、耐放且易於分享的巧克力形式就是M&M’s。這種色彩鮮豔的巧克力豆在便利商店的收銀台和飯店的自動販賣機中隨處可見,並且其包裝會重新設計以適應幾乎所有可商業化的美國假期。
在2022年我住在丹麥時,聽到了一個令人擔憂的說法:在歐洲製造的M&M’s味道與美國製造的不同,甚至可以說“更好”。雖然我知道高級的歐洲巧克力確實非常美味,並且常常優於美國巧克力,但我不確定這個說法是否也適用於M&M’s。我了解到許多歐洲人認為美國巧克力有一種“不愉快”或“酸”的味道,這主要歸因於丁酸,這是一種由於牛奶在製作牛奶巧克力前處理方式不同而產生的化合物。
但老實說,這對M&M’s的影響有多大呢?M&M’s!?我想M&M’s無論在哪裡製造都會保持相對加工/大規模生產/便宜糖果的味道。作為唯一的美國人,參加一個由國際科學家組成的多元化實驗室,這些科學家正在進行尖端的生物可持續性研究,我受到啟發,決定拿出我的數據科學工具箱,調查這個M&M’s味道現象。
1.2 先前的研究
引用一位歐洲女性的話,她在紐約旅行時品嚐了一顆美國的M&M’s後說:
“它們的味道真糟糕。像嘔吐。我不明白人們怎麼能吃這個。我把剩下的袋子扔掉了。”
嘔吐?真的嗎?根據我的經驗,在美國長大的孩子們對吃M&M’s並不感到厭惡。小時候,我習慣在家裡的高流量區域放置M&M’s的碗,以便隨時獲得糖分。顯然,美國的M&M’s是可以吃的。但它們真的與歐洲的M&M’s有顯著的不同或劣勢嗎?
針對這位匿名歐洲女性的尖銳評論,我和另外兩位在丹麥的美國人一起品嚐了在Lyngby Storcenter Føtex當地購買的M&M’s。我們希望能體驗到在我們的青春時期似乎隱藏的M&M’s味道的驚人改善。但奇怪的是,我們沒有檢測到明顯的味道改善。
不幸的是,這兩項初步研究都無法進行適當的對照和隨機的M&M’s品嚐。因此,我們轉向科學。
1.3 研究目標
這項研究旨在彌補之前缺乏徹底性的問題,並調查以下問題:
- 是否存在全球共識,認為歐洲的M&M’s確實比美國的M&M’s更好?
- 歐洲人是否真的能夠在不知道自己吃的是哪一種的情況下,區分美國和歐洲的M&M’s?還是這是歐洲人之間的一個大規模協調謊言,讓美國人感到尷尬?
- 美國人是否真的對美國和歐洲的M&M’s味道失去敏感?還是他們能夠品嚐到差異,但只是沒有將這種差異描述為“改善”?
- 這些所謂的味道差異是否能被其他大陸的公民所感知?如果是,他們是否覺得某一種味道明顯更好?
2. 方法
2.1 實驗設計與數據收集
參與者是通過邀請他們參加一個社交聚會(並承諾提供免費食物)來招募的,這個聚會恰好與測試地點位於同一地點。一旦參與者同意暫停社交並加入研究,他們就會被安排在一個測試站,由受過訓練的實驗者引導他們完成以下步驟:
- 參與者坐在桌子旁,收到兩個杯子:一個空杯和一個裝滿水的杯。每隻手各拿一個杯子,參與者被要求閉上眼睛,並在實驗的剩餘時間內保持閉眼。
- 實驗者隨機用勺子取出一顆M&M’s,放入參與者的空杯中,並要求參與者吃掉這顆M&M’s(眼睛仍然閉著)。
- 每吃完一顆M&M’s,實驗者會收集味道反應,詢問參與者是否認為這顆M&M’s的味道是:特別好、特別糟或正常。
- 每位參與者總共品嚐了10顆M&M’s(5顆歐洲的,5顆美國的),每次一顆,隨機順序由random.org決定。
- 在吃每顆M&M’s之間,參與者被要求喝一口水以幫助“清潔味蕾”。
- 收集的數據包括:對於每位參與者,實驗者記錄參與者的原籍大陸(如果不明確,參與者會被要求列出他們對於小時候吃糖果的最強烈記憶所在的大陸)。對於每顆送出的10顆M&M’s,實驗者記錄M&M’s的來源(“丹麥”或“美國”)、M&M’s的顏色以及參與者的味道反應。實驗者也被鼓勵記下參與者在測試過程中說的任何有趣的話語,並記錄在備註中(數據可在這裡獲得)。
2.2 材料來源與參與者招募
這項研究購買了兩袋M&M’s。美國來源的M&M’s(“美國M&M’s”)是在SFO機場購買的,並由作者的父母送到丹麥探望她。歐洲來源的M&M’s(“丹麥M&M’s”)是在哥本哈根北部的Lyngby當地Føtex超市購買的。
實驗在兩個主要時間點進行。第一批14位參與者是在2022年8月在丹麥Lyngby進行測試。他們大多是作者在丹麥技術大學(DTU)的Novo Nordisk基金會生物可持續性中心認識的朋友和室友,他們參加了一個“告別派對”,並在其中插入了實驗程序。還有一些在旅行中造訪丹麥的朋友和家人也參加了測試(例如,在火車上)。
剩下的37位參與者是在2022年10月在美國華盛頓州西雅圖進行測試,主要是在華盛頓大學計算機科學博士項目的研究生舉辦的“TGIF快樂時光”中進行的。這第二批主要由保羅·G·艾倫計算機科學與工程學院(UW CSE)的學生和工作人員組成,他們回應了每週五召喚到艾倫中心中庭享用免費小吃和飲料。
雖然這項研究旨在分析全球趨勢,但不幸的是,數據僅從51位參與者中收集,這些參與者是作者能夠招募到的,並且不平衡且不具代表性(圖1)。我們希望在未來的工作中改善我們的招募策略。現在,我們對這個數據集的分析能力僅限於來自北美、歐洲和亞洲的個體的反應趨勢,這在很大程度上受到作者在2022年晚些時候與之互動的子社區的偏見影響。
2.3 風險
雖然我們沒有獲得對人類受試者進行實驗的正式批准,但這項實驗存在一些小風險:參與者被警告可能會面臨增加的糖分和可能的“令人不快的味道”。沒有預期其他風險。
然而,在實驗後,我們不幸地觀察到幾個參與者在得知他們的味道反應對他們不期望的M&M’s類型偏向更積極時,感到自尊心受損。這種自尊心的下降在得知自己或未婚夫的偏好偏向美國M&M’s的歐洲參與者中似乎最為嚴重,儘管這並未進行定量測量,無法超出軼事證據進行確認。
3. 結果與討論
3.1 對“美國M&M’s”與“丹麥M&M’s”的整體反應
3.1.1 類別反應分析 — 整個數據集
在我們的第一次分析中,我們計算了“糟糕”、“正常”和“好”的味道反應總數,並報告每種M&M’s類型收到的每種反應的百分比。來自丹麥的M&M’s比美國的M&M’s更常收到“好”的反應,但也更常收到“糟糕”的反應。來自美國的M&M’s最常被報告為味道“正常”(圖2)。這可能是由於來自北美的參與者數量較多,而美國M&M’s是默認的,因此更“正常”,而丹麥M&M’s則更常被認為比基準更好或更糟。
圖2. 整個數據集的質性味道反應分佈。對於每種類型的M&M’s計算“糟糕”、“正常”或“好”的味道反應百分比。圖由Altair製作。
現在讓我們進行一些統計分析,例如卡方檢驗(X2)來比較我們觀察到的類別味道反應的分佈。使用scipy.stats的chi2_contingency函數,我們建立了觀察到的“好”、“正常”和“糟糕”反應的應變表。使用X2檢驗來評估兩種M&M’s之間沒有差異的虛無假設,我們發現檢驗統計量的p值為0.0185,這在常見的p值截止點0.05下是顯著的,但在0.01下則不顯著。因此,這是一個堅實的“也許”,取決於你是否希望這個結果是顯著的。
3.1.2 整個數據集的定量反應分析。
X2檢驗有助於評估類別反應之間是否存在差異,但接下來,我們想要確定兩種M&M’s類型之間的相對味道排名。為此,我們將味道反應轉換為定量分佈並計算味道分數。簡單來說,“糟糕”=1,“正常”=2,“好”=3。對於每位參與者,我們平均了他們品嚐的每種類型的5顆M&M’s的味道分數,並保持每種M&M’s類型的單獨味道分數。
圖3. 整個數據集的定量味道分數分佈。對每位參與者計算的每種類型的M&M’s的平均味道分數的核密度估計。圖由Seaborn製作。
有了每種M&M’s類型的平均味道分數,我們轉向scipy.stats的ttest_ind(“T檢驗”)來評估美國和丹麥M&M’s味道分數的均值是否不同(虛無假設是均值相同)。如果均值顯著不同,這將提供證據表明一種M&M’s被認為顯著比另一種更美味。
我們發現美國M&M’s和丹麥M&M’s的平均味道分數非常接近(圖3),且沒有顯著差異(T檢驗:p = 0.721)。因此,在所有參與者中,我們沒有觀察到兩種M&M’s類型之間的味道差異(或者如果你喜歡解析三重否定:“我們無法拒絕虛無假設,即不存在差異”)。
但如果我們按參與者的原籍大陸進行區分,這會有所改變嗎?
3.2 按大陸對“美國M&M’s”與“丹麥M&M’s”的反應
我們在按參與者的原籍大陸分組後重複了上述的X2和T檢驗分析。澳大利亞和南美洲的組合在一起,這是為了在最小程度上保護數據隱私。由於即使是合併的澳大利亞/南美洲組(n=3)的樣本量相對較小,我們將不對該組的趨勢進行分析,但會在幾個圖中包含數據,以便參與者享受。
3.2.1 按大陸的類別反應分析
在圖4中,我們顯示了每個大陸組的味道反應計數(上面面板,注意互動圖例)和反應百分比(下面面板)。北美和亞洲的趨勢與整個人口數據集相似:參與者報告丹麥M&M’s的“好”反應比美國M&M’s更頻繁,但也更頻繁地報告丹麥M&M’s的“糟糕”反應。美國M&M’s最常被報告為“正常”(圖4)。
相反,歐洲參與者報告美國M&M’s的“糟糕”反應幾乎達到50%,而“好”反應僅有18%,這是最負面和最少正面的反應模式(不包括樣本量不足的澳大利亞/南美洲組)。
圖4. 按大陸的質性味道反應分佈。上面面板:味道反應的計數—點擊圖例以互動過濾!下面面板:每種類型的M&M’s的味道反應百分比。圖由Altair製作。
這在條形圖中顯得引人注目,但只有北美的X2 p值顯著(p = 0.0058),在評估每個大陸的兩種M&M’s類型之間的味道反應特徵差異時。歐洲的p值在某些圈子中可能“接近顯著”,但我們即將累積幾個更多的假設檢驗,應該注意多重假設檢驗(表1)。這裡的假陽性結果將是毀滅性的。
當比較兩個大陸對同一M&M’s類型的味道反應特徵時,有幾個有趣的觀察。首先,我們在評估丹麥M&M’s時,未觀察到所有大陸對其之間的主要味道差異——世界對來自歐洲的M&M’s的感受範圍似乎普遍一致(右列X2 p值,表2)。為了更輕鬆地視覺化這種比較,我們重新排列圖4中的條形圖,以按M&M’s類型分組(圖5)。
圖5. 按M&M’s類型的質性味道反應分佈,報告為百分比。(與圖4相同的數據,但重新排列)。圖由Altair製作。
然而,在比較各大陸對美國M&M’s的反應時,我們看到更大的差異。我們發現一對配對顯著不同:歐洲和北美參與者對美國M&M’s的評價非常不同(p = 0.000007)(表2)。這種觀察到的差異不太可能是隨機機會造成的(左列,表2)。
3.2.2 按大陸的定量反應分析
我們再次將類別特徵轉換為定量分佈,以評估各大陸對M&M’s類型的相對偏好。對於北美,我們看到兩種M&M’s類型的味道分數均值實際上非常相似,但對於美國M&M’s的“正常”分數的密度更高(圖6A)。歐洲的分佈在均值上保持了更多的分離(雖然不太顯著),美國M&M’s的得分較低(圖6B)。亞洲參與者的味道分數分佈最為相似(圖6C)。
重新調整以比較各大陸對同一M&M’s類型的味道分數均值,只有北美和歐洲參與者對美國M&M’s的比較在T檢驗中顯著不同(p = 0.001)(圖6D),不過現在我們真的面臨多重假設檢驗的風險!如果你對這個分析稍微認真一點,請小心。
圖6. 按大陸的定量味道分數分佈。對每個大陸的每種類型的M&M’s計算的平均味道分數的核密度估計。A. 北美對每種類型的M&M’s的反應比較。B. 歐洲對每種類型的M&M’s的反應比較。C. 亞洲對每種類型的M&M’s的反應比較。D. 各大陸對美國M&M’s的比較。E. 各大陸對丹麥M&M’s的比較。圖由Seaborn製作。
此時,我開始考慮也許歐洲人並不是在胡說八道。我並不是說這有多戲劇性,但或許確實存在某種程度的差異,北美參與者也在某種程度上感知到差異,但對於來自歐洲的M&M’s的評價並不一致。
3.3 M&M’s味道對齊圖
在我們的分析中,我們沒有考慮參與者之間M&M’s欣賞的基線差異。例如,假設參與者1將所有丹麥M&M’s評分為“好”,而所有美國M&M’s評分為“正常”,而參與者2將所有丹麥M&M’s評分為“正常”,而所有美國M&M’s評分為“糟糕”。他們對丹麥M&M’s的相對偏好是相同的,但參與者2可能只是對M&M’s的喜愛程度不如參與者1,並且相對偏好的信號因平均原始分數而變得模糊。
受到桌上角色扮演遊戲(如《龍與地下城©™》)中使用的合法/混亂 x 善/惡對齊圖的啟發,在圖7中,我們建立了一個M&M’s對齊圖,以幫助確定參與者在M&M’s享受類別中的分佈。
圖7. M&M’s享受對齊圖。x軸表示參與者對美國M&M’s的平均味道分數;y軸是參與者對丹麥M&M’s的平均味道分數。圖由Altair製作。
值得注意的是,右上象限中兩種M&M’s類型都被視為“好”到“正常”的主要由北美參與者和少數亞洲參與者佔據。所有歐洲參與者都位於圖的左半部分,其中美國M&M’s的評分為“正常”到“糟糕”,但歐洲參與者在上下兩半之間有些分裂,丹麥M&M’s的評價範圍從“好”到“糟糕”。
圖7(互動):點擊並用滑鼠刷過散點圖以查看不同M&M’s對齊區域的各大陸計數。圖由Altair製作。
3.4 參與者味道反應比率
接下來,為了排除基線M&M’s享受的影響,專注於參與者對兩種M&M’s類型的相對偏好,我們計算了每位參與者的美國M&M’s味道分數平均值除以丹麥M&M’s味道分數平均值的對數比率。
圖8. 按大陸計算的參與者M&M’s偏好比率的分佈。偏好比率的計算如公式1所示。正數表示對美國M&M’s的相對偏好,而負數表示對丹麥M&M’s的相對偏好。圖由Seaborn製作。
平均而言,歐洲參與者對丹麥M&M’s的偏好最強,亞洲參與者也對丹麩M&M’s表現出輕微的偏好(圖8)。對於兩位在得知自己對美國M&M’s的輕微偏好而感到自尊心受損的歐洲人,別擔心:你們並不認為美國M&M’s是“好”的,而只是將它們評為不如丹麩M&M’s糟糕(參見圖7的參與者_id 4和17的互動版本)。如果你們主張M&M’s是美國的糟糕發明,不值得複製,並回到消費手工製作的歐洲巧克力,你們的榮譽可能會得到恢復。
北美參與者在他們的偏好比率中相當分裂:一些人中立地圍繞0,其他人強烈偏好熟悉的美國M&M’s,而少數人則適度偏好丹麩M&M’s。根據軼事,得知自己偏向歐洲M&M’s的北美參與者表現出自尊心膨脹的跡象,彷彿他們的結果顯示出高雅的品味。
總體而言,對M&M’s偏好比率的T檢驗顯示,歐洲和北美參與者之間的均值可能存在顯著差異(p = 0.049),但這是我報告的第20個p值——這個結果可能太接近無法判斷。
3.5 味道不一致性與“完美分類器”
對於每位參與者,我們通過計算他們對每種M&M’s類型的反應的標準差的平均值,評估他們的味道分數一致性,並將其繪製與他們的偏好比率進行比較(圖9)。
圖9. 按偏好比率的參與者味道一致性。x軸是參與者的相對M&M’s偏好比率。y軸是他們對美國M&M’s分數的標準差和丹麩M&M’s分數的標準差的平均值。y軸上的0值表示反應的完美一致性,而更高的值表示反應的不一致性。圖由Altair製作。
大多數參與者在評分上有些不一致,對同一類型的M&M’s在5個樣本中給予不同的評分。如果歐洲來源和美國來源的M&M’s之間的味道差異實際上並不明顯,這是可以預期的。最不一致的參與者對同一類型的M&M’s給予了“好”、“正常”和“糟糕”的評價(例如,y軸上高的點,味道分數的標準差更大),這表明他們的味覺感知能力較低。
有趣的是,四位參與者——每個大陸組各一位——表現得非常一致:他們對每種類型的5顆M&M’s報告相同的味道反應,導致平均標準差為0.0(圖9底部)。排除其中一位僅將所有10顆M&M’s評為“正常”的參與者,其他三位似乎是“完美分類器”——要麼將一種類型的所有M&M’s評為“好”,而另一種評為“正常”,要麼將一種類型的所有M&M’s評為“正常”,而另一種評為“糟糕”。也許這些人是“超味者”。
3.6 M&M’s顏色
另一個可能解釋個別味道反應不一致的原因是,根據M&M’s的顏色存在可感知的味道差異。從視覺上看,美國的M&M’s明顯比丹麩的M&M’s更光滑、更鮮豔,而丹麩的M&M’s則顯得有些“斑駁”(圖10A)。在實驗中記錄了M&M’s的顏色,儘管平衡取樣並未正式納入實驗設計,但顏色似乎大致均勻取樣,除了藍色美國M&M’s被過度取樣(圖10B)。
我們簡要視覺化了根據顏色的味道反應可能存在的差異(圖11),然而我們認為數據不足以支持確定的結論。畢竟,平均而言,每位參與者可能只品嚐到5種顏色中的1種,而1種顏色則根本沒有品嚐到。我們將進一步的M&M’s顏色研究留給未來的工作。
3.7 色彩評論
我們向每位參與者保證,這項實驗中沒有“正確”的答案,所有感受都是有效的。雖然一些參與者心領神會,偶爾花超過一分鐘深切品味每顆M&M’s,並評價它們就像他們是品酒師,但許多參與者似乎將這項實驗視為一場比賽(這偶爾導致自尊心受損或膨脹)。實驗者在M&M’s反應的同時記錄了引用和備註,其中一些有點“色彩斑斕”。我們提供了每種類型的M&M’s的快速生成的詞雲以供娛樂(圖12),儘管我們警告在沒有仔細情感分析的情況下不要過度解讀它們。
4. 結論
總的來說,似乎並不存在“全球共識”認為歐洲的M&M’s比美國的M&M’s更好。然而,歐洲參與者對美國M&M’s的負面反應表達得更強烈,而北美參與者似乎在是否偏好來自美國或來自歐洲的M&M’s上相對分裂。亞洲參與者的偏好趨勢往往介於北美和歐洲之間。
因此,我承認,歐洲人並不是在對M&M’s進行一場大規模的協調謊言。大多數歐洲參與者對丹麩M&M’s的偏向令人信服,特別是因為我是實驗者,親自收集了大部分味道反應數據。如果他們找到了一種作弊的方法,那麼這種方法足夠好,以至於超過了我自己的被動感知,讓我沒有注意到。然而,根據這項研究,強烈的負面“嘔吐味”並不是普遍感知的,並且在非歐洲人品嚐兩種M&M’s類型時不會顯現出來。
我們希望這項研究能帶來啟發!我們期待在未來的工作中擴展這項研究,改善參與者的取樣,增加來自其他大陸的M&M’s類型,並深入調查可能由顏色引起的味道差異。
感謝所有參與者和為科學而吃M&M’s的人!
圖表和分析可在github上找到:https://github.com/erinhwilson/mnm-taste-test
文章由Erin H. Wilson, Ph.D.撰寫,她決定在辯護論文和開始下一份工作之間的時間最好用來進行這項非常有價值的分析。希望這篇文章的意圖是幽默的——我對不喜歡美國M&M’s的歐洲人並沒有任何負面情緒,但享受了用過於熱情的數據分析來調侃我們生動辯論的機會。
感謝Matt、Galen、Ameya和Gian-Marco在數據收集中的協助!
[1] 華盛頓大學保羅·G·艾倫計算機科學與工程學院的前博士生
[2] 丹麥技術大學Novo Nordisk基金會生物可持續性中心的前訪問博士生
[3] LanzaTech的未來數據科學家
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!