在DATAVERSITY會議上,與數據專業人士聚會的感覺真是無與倫比,無論是老朋友還是新朋友。上個月的活動特別特別,結合了久負盛名的數據治理與信息質量(DGIQ)東部會議和首次舉辦的人工智慧治理會議(AIGov)。更令人興奮的是,擴展了女性數據管理與治理(WDMG)計畫。這次活動內容豐富,無論是新手還是資深專家,都能找到適合自己的內容。
DATAVERSITY的創始人兼首席執行官Tony Shaw在開幕會議中強調,這個數據社區的文化使我們能夠分享重要見解,向行業領袖學習,並建立支持我們在組織內部創造價值的聯繫。以下是這次突破性DGIQ東部會議和AI治理會議的主要收穫。
什麼是AI治理?
當數據治理專業人士聚集在一起時,對會議的一些關鍵定義達成共識是非常重要的。雖然為初學者重溫了基礎的數據治理術語,但對AI和AI治理的清晰定義成為了會議的一個重要亮點。包括Jimm Johnson的課程在內的教程,揭示了AI術語的同心圓。以下是他從Andre Retterath那裡分享的定義:
人工智慧(AI):機器所展現的智慧,與人類或其他動物所展現的智慧相對。“智慧”包括學習和推理的能力、概括和推斷意義的能力。
機器學習(ML):AI的一個分支,專注於使用數據和算法模仿人類學習的方式,逐漸提高準確性。
深度學習(DL):ML方法的一部分,總結了以層次結構組織的算法,以創建“人工神經網絡”。這些算法可以像人腦一樣學習並自主做出智能決策。
生成式AI(GenAI):DL模型的一個子集,可以學習其輸入訓練數據的模式,然後生成具有相似特徵的高質量文本、圖像和其他內容。
生成式預訓練變壓器(GPT):一種利用新型變壓器架構的GenAI模型,擅長捕捉長期依賴性和學習數據序列中的上下文關係。
大型語言模型(LLM):一種GPT算法,可以根據從大量數據集中獲得的知識識別、總結、翻譯、預測和生成文本及其他內容形式。
GPT-4:由OpenAI訓練和提供的最新GPT模型版本,是GPT-3.5、GPT-3和GPT-2的繼任者。
ChatGPT:一個聊天機器人界面,允許用戶通過自然語言與GPT-4和其他版本互動,而不是使用代碼。
這些技術進步是歷史上最快被採用的技術之一,ChatGPT在推出後僅兩個月內就達到了1億用戶。隨著AI在消費者和企業環境中的擴展,組織需要實施治理結構以確保負責任的使用,因此需要AI治理。國際隱私專業人員協會(IAPP)將組織的AI治理定義為組織為確保負責任地開發、部署或使用AI而遵循的內部指導方針和實踐。
AI治理的許多方面可能包括記錄嵌入AI的第三方工具,這些工具現在滲透並因此對組織造成風險。它還包括通過評估每個用例的價值、努力和風險來引入和監控組織內的AI用例。然後是管理輸入的風險,這主要被認為是當今的數據治理;但現在還包括減輕不當訓練模型的風險,這些模型的輸入可能導致偏見、幻覺(更常見的稱為不準確性)和模型漂移等問題。這導致了對算法和模型本身的治理,並借助AI專家的幫助。最後,還有輸出風險管理,以及它們如何影響版權規則、商業損害和代理法律。例如,AI代理的輸出最近在法庭上被認定為真正代表公司行事,即使它“幻覺”了。
AI的現狀
無論人們是否相信AI最終能使一個人運營一家價值十億美元的公司,或者很快會陷入著名的“失望低谷”,目前有一件事是明確的:70-80%的公司已經在使用GenAI,Malcolm Hawker指出。Gartner指出,當今公司使用GenAI的主要方式是通過利用嵌入現有應用程序中的GenAI,例如Google Gemini、Microsoft 365 Copilot、蘋果公司 (Apple Inc.) Intelligence、Adobe AI或Zoom AI Companion。滿足GenAI用例的其他方法包括定制GenAI、訓練GenAI模型和使用獨立的GenAI工具。
AI法規
隨著預計到2030年AI將為全球GDP貢獻15.7萬億美元(超過英國五年的GDP),有關法規的討論成為焦點。目前,全球約有35項與AI相關的法規,未來預計會有更多。當前的主要法規是歐盟AI法案,根據第5條,將於2025年2月開始執行,可能會設立類似GDPR的先例。在美國,AI治理法規正在通過行政命令、州級倡議(例如加州、科羅拉多州、馬里蘭州和伊利諾伊州)以及像紐約市144號法案等地方措施推進。預計還會出現行業特定的法規,強調組織需要提前應對合規要求。
AI工具
隨著AI(和數據)的合規要求不斷增加,還需要注意當前可用的多種工具和技術,以支持AI和AI治理的不同能力。Sunil Soares將這些工具分為不同的供應商組別(不分先後):
超大規模供應商:Microsoft、Google Cloud、AWS、Meta、IBM
數據隱私:Dastra、DataGrail、OneTrust、TrustArc、Transcend、TrustWorks、Zendata
數據科學:DataRobot、Dataiku、SAS
數據雲:Snowflake、Databricks
數據治理與目錄:Alation、Atlan、Collibra、Data.world和Informatica
專注於AI治理:anch.AI、BreezeML、Credo AI、Enz.AI、Fairly AI、Fairnow、Holistic AI、Monitaur、Modulos AI、Prodago、QuantPi、Relyance AI、Saidot、Trustible、YOOI、2021.AI
透明性與可解釋性:
可解釋性:causaLens、LIME、parabole.ai、SHAP
內容來源:Content Credentials、Google SynthID、Nightshade
公平性:Fairlearn
AI的財務運營:Finout
合規性評估:AI Verify Foundation
數據標註:CloudFactory、Innodata、Scale AI
治理、風險與合規:Archer、MetricStream、ServiceNow
AI開發:Athina AI、BigML、Glean、HoneyHive、Humanloop、LatticeFlow AI、MLflow、neptune.ai、Patronus AI、PromptBase、PromptLayer、SilkFlo、Weights & Biases
AI可觀察性:Arize AI、Arthur AI、Deeploy、Fiddler AI、WhyLabs
AI安全與隱私增強技術(PETs):
AI安全姿態管理:Protect AI、Palo Alto、Cranium AI、Securiti、BigID、Immuta
聯邦學習:Curatio、Sherpa.ai、TensorOpera
紅隊測試:Adversarial Robustness Toolbox (ART)、Azure PyRIT
合成數據:Synthetic Data Vault (SDV)、MOSTLY AI、Synthea
護欄:Guardrails AI、Credal、Lakera AI、Robust Intelligence
AI治理框架
在數據治理方面,有現有的框架可以幫助組織實施AI治理,利用行業從業者、大型組織和公共實體的專業知識。Sunil Soares在他的免費可下載書籍《AI治理綜合指南:工具、供應商、控制和法規》中提供了一個包含13個組件的AI治理框架。Nicole Janeway Bills和John O’Donovan還提供了七個著名的AI治理框架的比較,這些框架適合企業使用,包括來自新加坡、Microsoft、歐洲理事會、OECD、NIST、Google和AWS的框架。這些資料可以在他們的數據策略專業人士網站上找到。
組織和我的職業的價值在哪裡?
AI治理的使用案例
AI所能提供的節省時間的效率和有價值的見解已經被廣為人知並記錄多年。因此,討論的最大使用案例是管理AI對企業所帶來的風險,主要是避免來自當前和未來法規(例如歐盟AI法案)的罰款,這些罰款的潛在金額可能超過GDPR,根據Sunil的說法。
然而,Sunil還補充了AI治理的另一個商業驅動因素。他發現,隨著公司闡明為何應在企業中採用AI的理由,AI治理本身實際上被發現是這些理由中的前三名。這是因為在組織內正確設置的AI治理計畫,對於加速更多AI的採用、使用案例,從而為該組織創造價值,具有競爭優勢。
利用GenAI進行數據治理的使用案例
在了解數據治理如何為AI提供AI治理之後,另一個討論點是:AI能為數據治理做什麼?Junaid Farooq分享了一個更全面的40個具體GenAI使用案例的列表,並映射了它們的相對價值、努力和風險。一些最重要的使用案例包括:自動數據分類、重複檢測、數據分析、參考數據交叉檢查和數據攝取的文本解析。
利用這一機會進行職業發展
正如《紐約時報》所觀察到的,“許多人擔心人工智慧會取代工作。但醫院、保險公司和其他機構正在創造角色,以導航和利用這一顛覆性技術。”根據《紐約時報》的說法,負責AI的高管可能成為美國企業中最熱門的工作,Sunil發現,根據LinkedIn Sales Navigator的數據(截至2024年2月9日),已有超過2500人擔任首席AI官一職。最後,在一場小組討論中,William A. Tanenbaum指出,對於律師來說,Johna Till Johnson將這一說法應用於所有員工:“不是AI會取代你的工作,而是懂得並利用AI的員工會取代不懂的員工。”
總之,幾乎每位演講者都以自己的方式表示,會議的最大收穫是:作為數據治理專業人士,我們是時候站出來把握這一時刻。Scott Taylor鼓勵我們實現“真相優先於意義”,通過有效地向組織講述我們的數據故事,利用業務本身的願景和語言。Melissa Harrington鼓勵我們在領導中更真誠,研究表明,這能使員工參與度提高76%(這是全球一個5000億美元的問題)!Irene Dirks展示了使用樂高積木實施引人入勝的數據治理計畫的創意方法。最後,Malcolm Hawker鼓勵我們成為組織的英雄,因為我們的公司需要我們這些數據專業人士來引領AI驅動的業務。
結論
Mathias Vercauteren將我們當前的AI環境比作20世紀初駕駛汽車時沒有安全帶、護欄和限速。Laura Madsen敏銳地指出,儘管歷史上革命是如此實現的,但我們知道我們的時代有兩件事:1)我們肯定正處於AI革命的中間;2)雖然沒有人知道未來AI會發生什麼,但我們知道顛覆即將來臨。
數據治理專業人士已經具備推動組織AI治理所需的多領域技能。因此,儘管這是大多數與會者首次接觸AI治理,但許多人鼓勵我們負責任地增加AI的使用,幫助總法律顧問專注於公司政策,通過有效的數據治理為未來的AI用例準備數據,更加熟悉現有和即將出台的法規,最重要的是,成為這一領域的領導者,並在我們的組織中成為英雄!
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!