相關性在數據科學中的聲譽
在數據科學家中,相關性有點不好的名聲。時不時我會看到一些誇張的標題,比如「相關性已死」、「再見相關性」、「這裡有一個替代相關性的方法」等等。
相關性仍然存在
但事實是,相關性仍然非常活躍且蓬勃發展。這是因為在實際應用中,它作為兩個變數之間關係強度的代理指標,表現得非常好,而且簡單易懂,沒有其他方法能比擬。
相關性的缺點
不過,相關性確實有一個主要的缺點。作為一個單變量的指標,它無法考慮其他可能影響測量的變數。這導致了統計學中著名的說法:「相關性不代表因果關係。」
部分相關性的優勢
幸運的是,存在一種更通用的版本——稱為部分相關性——它保留了簡單相關性的所有優點,同時解決了其主要限制。
部分相關性仍不為人知
然而,令人驚訝的是,部分相關性仍然不為大多數人所知。它不受歡迎的證據是,它只在一個Python庫中實現,叫做Pingouin——這對於大多數數據科學家來說並不是首選的庫。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!