在人工智慧數據治理中應該期待什麼：2025年預測

在2025年，防範網路犯罪和人工智慧（AI）使用的風險將成為大多數首席資訊官（CIO）的首要任務。特別是勒索病毒持續困擾企業，而非結構化數據則是一個龐大且大部分未受保護的資產。AI解決方案已經從實驗階段轉向主流，所有主要科技公司和雲端服務提供商都在為企業客戶大力投資，建立即用型的生成式AI（GenAI）和AI解決方案。首席體驗官希望利用AI，但不希望因不負責任的使用而損害客戶關係、聲譽和市場份額。負責數據和基礎設施的IT專業人員需要做好準備，因為員工開始將公司數據發送給AI。以下預測著重於正確管理AI數據治理的緊迫性——從系統和政策到IT技能。

系統化數據攝取將成為首要的數據儲存任務

AI的熱潮令人驚嘆，但到目前為止，企業的參與主要來自於使用生成式AI工具來協助日常任務的員工，例如寫作、研究和基本分析。AI模型的訓練主要由專家負責，而儲存IT並未參與AI。但這在未來一年將迅速改變。商業領導者知道，如果在AI的黃金熱潮中落後，他們可能會失去市場份額、客戶和相關性。企業數據將與AI一起用於RAG（檢索增強生成）和推理，這將在未來占據90%的AI投資。每個接觸數據和基礎設施的人都需要站出來，因為日常員工開始將公司數據發送給AI。儲存IT需要建立系統，讓用戶能夠在企業數據庫中搜索、整理正確的數據、檢查敏感數據，並將數據移送至AI，同時提供審計報告。儲存管理者需要清楚支持他們的業務和IT同事的需求。

非結構化數據治理流程將成熟

保護企業數據不被洩漏和濫用，以及防止AI產生不必要的錯誤結果，都是當前高層主管最關心的問題。北美缺乏一致的標準、指導方針和法規，使得這項任務變得更加困難。IT領導者可以開始使用數據管理技術，獲得對所有非結構化數據的可見性。這種可見性是更好理解這不斷增長的數據量的起點，以便能夠妥善管理和治理AI。數據分類是AI數據治理的另一個關鍵步驟，涉及用標籤豐富文件元數據，以識別不能在AI程序中使用的敏感數據。元數據豐富化還可以幫助研究人員和數據科學家快速整理他們項目的數據集，通過搜索識別文件內容的關鍵字。通過自動化的數據分類流程，IT可以創建工作流程，持續將受保護的數據集發送到安全位置，並單獨將AI準備好的數據集發送到物件儲存中，讓AI工具進行攝取。自動化的數據工作流程協調工具將對於高效管理這些任務至關重要，尤其是在PB（千兆位元組）級別的數據環境中。AI準備好的非結構化數據管理解決方案還將提供監控進行中的工作流程和審計結果的手段，以降低風險。

儲存管理員的角色發展以擁抱安全性和AI數據治理

對數據安全和AI的迫切需求正在改變儲存IT專業人員的角色。儲存管理的工作已經演變，技術現在更加自動化、自我修復、基於雲端且更易於管理。與此同時，網路安全、數據隱私、儲存和AI之間的重疊和相互依賴性也在增加。儲存專業人員需要使數據易於訪問並為AI進行分類，同時跨部門合作創建數據治理計劃，以對抗勒索病毒並防止企業數據在AI中的濫用。儲存團隊需要知道敏感數據的潛在位置，並擁有工具來開發可審計的數據工作流程，以防止敏感數據洩漏。

非結構化數據的勒索病毒防禦變得更加緊迫

傳統上，數據保護主要集中在關鍵任務數據上，因為這些數據需要更快的恢復。然而，隨著非結構化數據的增長，這一情況已經改變，非結構化數據在過去十年中佔據了90%的所有生成數據。PB級別的非結構化數據的巨大面積，加上其廣泛使用和快速增長，使其對勒索病毒攻擊高度脆弱。網路犯罪分子可以利用非結構化數據作為特洛伊木馬來感染企業。以成本效益的方式保護非結構化數據免受勒索病毒攻擊將成為一項關鍵的防禦策略，首先要將冷數據和不活躍數據移動到不可修改的物件儲存中。

非結構化數據管理解決方案擴展以滿足AI數據治理和監控需求

我公司的2024年非結構化數據管理狀態報告顯示，IT領導者將AI數據治理和安全性作為未來解決方案的首要能力。AI數據治理涵蓋了保護數據不受洩漏或濫用、維持行業法規的合規性、管理數據偏見，以及確保AI不會導致虛假、誤導或誹謗的結果。對容量問題或異常的監控和警報，去年最受歡迎的選擇再次高居榜首，並與分析和報告一起持續受到重視。IT和儲存主管將尋找提供自動化能力的非結構化數據管理解決方案，以保護、分段和審計敏感和內部數據在AI中的使用——這一用例隨著AI的成熟必然會擴展。

新聞來源

本文由 AI 台灣 運用 AI 技術編撰，內容僅供參考，請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團，
隨時掌握最新 AI 動態與實用資訊！