MIT新聞:生成式人工智慧的環境影響
在一系列的兩篇文章中,麻省理工學院新聞探討了生成式人工智慧的環境影響。在這篇文章中,我們將了解為什麼這項技術需要如此多的資源。第二篇文章將調查專家們正在做什麼來減少生成式人工智慧的碳足跡和其他影響。
生成式人工智慧的潛在好處引起了人們的興奮,從提高工作效率到推進科學研究,這些好處很難被忽視。雖然這項新技術的快速增長使得許多行業能夠迅速部署強大的模型,但這場生成式人工智慧的“淘金熱”所帶來的環境後果仍然難以確定,更不用說減少了。
訓練生成式人工智慧模型所需的計算能力,通常擁有數十億個參數,例如OpenAI的GPT-4,會消耗驚人的電力,這導致二氧化碳排放增加,並對電網造成壓力。
此外,將這些模型應用於現實世界中,讓數百萬人能在日常生活中使用生成式人工智慧,然後再調整模型以提高其性能,會在模型開發後長時間內消耗大量能源。
除了電力需求外,訓練、部署和調整生成式人工智慧模型所使用的硬體需要大量水來冷卻,這可能會對市政供水造成壓力,並擾亂當地生態系統。生成式人工智慧應用的增加也促使對高效能計算硬體的需求上升,這在其製造和運輸過程中也帶來了間接的環境影響。
麻省理工學院材料科學與工程系的教授、麻省理工學院新氣候計畫的去碳化任務負責人Elsa A. Olivetti說:“當我們思考生成式人工智慧的環境影響時,不僅僅是插上電腦時消耗的電力。還有更廣泛的後果,這些後果基於我們的行動而持續存在。”
Olivetti是2024年一篇名為《生成式人工智慧的氣候和可持續性影響》的論文的主要作者,該論文是麻省理工學院同事共同撰寫的,回應了麻省理工學院對探索生成式人工智慧對社會的正面和負面轉變潛力的徵稿。
數據中心的需求
數據中心的電力需求是生成式人工智慧環境影響的一個主要因素,因為數據中心用來訓練和運行像ChatGPT和DALL-E這樣的深度學習模型。
數據中心是一個溫控建築,內部包含計算基礎設施,例如伺服器、數據存儲驅動器和網絡設備。例如,亞馬遜在全球擁有超過100個數據中心,每個數據中心大約有50,000台伺服器,用於支持雲計算服務。
雖然數據中心自1940年代以來就存在(第一個數據中心於1945年在賓夕法尼亞大學建成,以支持第一台通用數位電腦ENIAC),但生成式人工智慧的興起大幅提高了數據中心的建設速度。
麻省理工學院氣候與可持續性聯盟(MCSC)的計算與氣候影響研究員Noman Bashir表示:“生成式人工智慧所需的功率密度是不同的。從根本上說,它只是計算,但生成式人工智慧訓練集群的能耗可能是典型計算工作負載的七到八倍。”
科學家估計,北美數據中心的電力需求從2022年底的2,688兆瓦增加到2023年底的5,341兆瓦,部分原因是生成式人工智慧的需求。根據經濟合作與發展組織的數據,全球數據中心的電力消耗在2022年達到460太瓦,這使得數據中心成為世界第11大電力消費者,介於沙烏地阿拉伯(371太瓦)和法國(463太瓦)之間。
到2026年,數據中心的電力消耗預計將接近1,050太瓦(這將使數據中心在全球排名中上升到第五位,介於日本和俄羅斯之間)。
雖然並非所有數據中心的計算都涉及生成式人工智慧,但這項技術已成為能源需求增加的主要推動力。
Bashir說:“新數據中心的需求無法以可持續的方式滿足。公司建設新數據中心的速度意味著大部分電力必須來自化石燃料發電廠。”
訓練和部署像OpenAI的GPT-3這樣的模型所需的電力難以確定。在2021年的一篇研究論文中,谷歌和加州大學伯克利分校的科學家估計,僅訓練過程就消耗了1,287兆瓦小時的電力(足以供應約120個美國家庭一年的用電),並產生約552噸的二氧化碳。
雖然所有機器學習模型都必須進行訓練,但Bashir解釋說,生成式人工智慧獨特的一個問題是訓練過程中能耗的快速波動。
電網運營商必須有辦法吸收這些波動以保護電網,通常會使用柴油發電機來完成這項任務。
推理帶來的影響增加
一旦生成式人工智慧模型訓練完成,能源需求並不會消失。
每次使用模型時,例如個人請ChatGPT總結一封電子郵件,執行這些操作的計算硬體都會消耗電力。研究人員估計,一次ChatGPT查詢的電力消耗約是簡單網頁搜索的五倍。
Bashir說:“但日常用戶不會太在意這一點。生成式人工智慧界面的易用性以及缺乏有關我行為的環境影響的信息,意味著作為用戶,我沒有太多動機去減少對生成式人工智慧的使用。”
在傳統人工智慧中,能耗在數據處理、模型訓練和推理之間相對均勻分配,推理是使用訓練好的模型對新數據進行預測的過程。然而,Bashir預計生成式人工智慧推理的電力需求最終將主導,因為這些模型在許多應用中變得無處不在,未來版本的模型將變得更大、更複雜,推理所需的電力將增加。
此外,生成式人工智慧模型的壽命特別短,這是由於對新人工智慧應用的需求上升。公司每幾週就會推出新模型,因此訓練先前版本所消耗的能源會浪費掉。新模型通常需要更多的能源進行訓練,因為它們的參數通常比前一代更多。
雖然數據中心的電力需求可能在研究文獻中受到最多關注,但這些設施消耗的水量也有環境影響。
冷卻數據中心需要使用冷卻水來吸收計算設備的熱量。Bashir表示,據估計,數據中心每消耗一千瓦時的能源,就需要兩升水來冷卻。
Bashir說:“僅僅因為這被稱為‘雲計算’,並不意味著硬體生活在雲中。數據中心存在於我們的物理世界中,因為它們的用水量對生物多樣性有直接和間接的影響。”
數據中心內的計算硬體也帶來了自己的間接環境影響。
雖然很難估計製造一個GPU(能處理密集生成式人工智慧工作負載的強大處理器)所需的電力,但這會比生產一個簡單的CPU需要更多,因為製造過程更為複雜。GPU的碳足跡還受到材料和產品運輸相關排放的影響。
市場研究公司TechInsights估計,三大主要生產商(NVIDIA、AMD和Intel)在2023年向數據中心運送了385萬個GPU,較2022年的267萬個有所增加。預計到2024年,這一數字將以更大的百分比增長。
這個行業正走在一條不可持續的道路上,但Bashir表示,有方法可以促進生成式人工智慧的負責任發展,以支持環境目標。
他、Olivetti和他們的麻省理工學院同事認為,這需要全面考慮生成式人工智慧的所有環境和社會成本,以及對其感知利益的詳細評估。
Olivetti說:“我們需要一種更具上下文的方式來系統性和全面地理解這一領域新發展的影響。由於改進的速度,我們還沒有機會跟上我們測量和理解權衡的能力。”
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!