將人工智慧與人類價值觀對齊 | 麻省理工學院新聞

奧德莉·洛爾沃 (Audrey Lorvo) 的人工智慧安全研究

大四學生奧德莉·洛爾沃正在研究人工智慧 (AI) 的安全性，這項研究旨在確保越來越智能的AI模型是可靠的，並能夠造福人類。這個不斷增長的領域專注於技術挑戰，例如穩健性和AI與人類價值觀的一致性，以及社會問題，如透明度和問責制。從業者也關心與越來越強大的AI工具相關的潛在生存風險。

洛爾沃說：「隨著我們接近人工通用智慧 (AGI)，確保AI不被濫用或不違背我們的意圖變得越來越重要。」AGI指的是人工智慧能夠匹配或超越人類認知能力的潛力。

作為麻省理工學院 (MIT) 施瓦茲曼計算學院 (Schwarzman College of Computing) 社會與計算的倫理責任 (SERC) 學者，洛爾沃密切關注AI如何自動化AI研究和開發過程及實踐。她是大數據研究小組的成員，正在調查AI加速自我研究的社會和經濟影響，以及如何有效地將這些想法和潛在影響傳達給包括立法者、戰略顧問等在內的大眾。

洛爾沃強調需要批判性地評估AI的快速進展及其影響，確保組織擁有適當的框架和策略來應對風險。她說：「我們需要確保人類能夠獲得AI的好處，同時不失去對技術的控制。我們需要竭盡所能地安全開發它。」

她參加像是AI安全技術獎學金 (AI Safety Technical Fellowship) 的努力，反映出她對理解AI安全技術方面的投入。這個獎學金提供了檢視現有研究的機會，這些研究將AI開發與潛在的人類影響考量相結合。她說：「這個獎學金幫助我理解AI安全的技術問題和挑戰，讓我能夠提出更好的AI治理策略。」根據洛爾沃的說法，處於AI前沿的公司不斷推進界限，這意味著我們需要實施有效的政策，優先考慮人類安全，而不妨礙研究。

人類參與的價值

當洛爾沃來到MIT時，她知道自己想要追求一個能夠讓她在科學與人文之間工作的學習方向。然而，學院提供的多樣選擇讓她的選擇變得困難。

她說：「有這麼多方法可以幫助改善個人和社區的生活品質，而MIT提供了這麼多不同的探索路徑。」

洛爾沃最初選擇經濟學——這是一個她喜歡的學科，因為它專注於量化影響——她在選擇6-14課程之前，還研究了數學、政治學和城市規劃。

她說：「喬舒亞·安格里斯 (Joshua Angrist) 教授的計量經濟學課程幫助我看到了專注於經濟學的價值，而數據科學和計算機科學的元素吸引了我，因為AI的影響力和潛力不斷增長。我們可以利用這些工具來解決一些世界上最緊迫的問題，並希望克服嚴重挑戰。」

洛爾沃還追求城市研究與規劃及國際發展的專業。

隨著她逐漸縮小焦點，洛爾沃發現自己與MIT社群中的其他成員，如MIT AI對齊小組，分享著對人類的看法，從中她學到了很多關於AI安全的知識。她說：「學生們關心他們的邊際影響。」

邊際影響是指特定的時間、金錢或努力的投資所帶來的額外效果，這是一種衡量貢獻對現有工作的增值，而不是專注於總影響的方法。這可能會影響人們選擇將資源投入到哪裡，這個想法吸引了洛爾沃。

她說：「在資源有限的世界中，數據驅動的方法來解決我們最大的一些挑戰，可以受益於一種量身定制的方法，將人們引導到他們最有可能做出貢獻的地方。如果你想最大化你的社會影響，反思你的職業選擇的邊際影響會非常有價值。」

洛爾沃也重視MIT對全面教育的重視，並利用機會通過MIT Concourse探索哲學等學科，這是一個促進科學與人文對話的計劃。Concourse希望參與者能夠獲得指導、清晰和目的，來追求科學、技術和人文的目標。

在MIT的學生經歷

洛爾沃在課外投入時間創造難忘的經歷，並與同學建立關係。她說：「我很幸運有空間來平衡我的課業、研究和社團活動，還有其他活動，比如舉重和校外計劃。學院裡總是有這麼多社團和活動可參加。」

這些擴展她世界觀的機會挑戰了她的信念，並讓她接觸到新的興趣領域，這些都讓她的生活和職業選擇變得更好。洛爾沃流利使用法語、英語、西班牙語和葡萄牙語，並讚揚MIT為學生提供的國際經驗。

她說：「我曾在智利聖地亞哥和巴黎實習，參加MISTI計劃，並幫助測試我們在2023年秋季D-Lab課程中設計的水蒸氣冷凝室，這是與馬達加斯加理工學院和Tatirano NGO（非政府組織）的合作。」她說：「我也很享受通過我的國際發展和D-Lab課程學習解決經濟不平等的機會。」

作為MIT本科經濟學協會的會長，洛爾沃與其他對經濟學感興趣的學生建立聯繫，同時繼續擴展對該領域的理解。她喜歡自己建立的關係，並參加協會全年舉辦的活動。她說：「即使作為大四學生，我也發現了新的校園社群可以探索和欣賞。我鼓勵其他學生在MIT的學習期間，繼續探索能激發他們興趣的團體和課程。」

畢業後，洛爾沃希望繼續研究AI安全，並研究治理策略，以確保AI的安全和有效部署。

她說：「良好的治理對於AI的成功發展至關重要，並確保人類能夠從其變革潛力中受益。我們必須繼續監控AI的增長和能力，隨著技術的持續演變。」

理解技術對人類的潛在影響、做好事、持續改進，以及創造讓大想法得以實現的空間，這些都驅動著洛爾沃。將人文與科學結合起來是她所做的許多事情的核心。她說：「我一直希望能為改善人們的生活做出貢獻，而AI代表著人類面臨的最大挑戰和機會。我相信AI安全領域可以從像我這樣擁有跨學科經驗的人身上受益，我鼓勵任何對塑造未來充滿熱情的人去探索這個領域。」

新聞來源

本文由 AI 台灣 運用 AI 技術編撰，內容僅供參考，請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團，
隨時掌握最新 AI 動態與實用資訊！

Tags: ai ethics AI legislation AI safety AI Safety Technical Fellowship artificial general intelligence (AGI)Audrey Lorvo Joshua Angrist MISTI MIT AI Alignment group MIT Concourse Program MIT D-Lab MIT DUSP MIT SERC MIT SHASS 將人工智慧與人類價值觀對齊麻省理工學院新聞

將人工智慧與人類價值觀對齊 | 麻省理工學院新聞

數據科學前沿將作為獨立出版物啟動

Google DeepMind 研究人員解鎖基於解碼的回歸在表格和密度估計任務中的潛力

Related Posts

中國教育改革人工智慧助力創新人才培育

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破

全球AI教育市場蓬勃發展智慧學習工具引領新趨勢

2027 年 AI 預測人類水平 AI 的全新里程碑

AI 技術對人類智能的影響我們在失去什麼？

人工智慧重塑遊戲開發遊戲未來從現在開始

Google DeepMind 研究人員解鎖基於解碼的回歸在表格和密度估計任務中的潛力

在Django中使用游標整合Stripe支付

發佈留言取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

將人工智慧與人類價值觀對齊 | 麻省理工學院新聞

奧德莉·洛爾沃 (Audrey Lorvo) 的人工智慧安全研究

人類參與的價值

在MIT的學生經歷

數據科學前沿將作為獨立出版物啟動

Google DeepMind 研究人員解鎖基於解碼的回歸在表格和密度估計任務中的潛力

Related Posts

發佈留言 取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

發佈留言取消回覆