在現今數據驅動的商業環境中,資料治理(Data Governance)扮演著確保數據品質、完整性和安全性的關鍵角色。透過明確的政策和流程,企業能夠有效管理數據的使用,支持業務決策和運營。
什麼是資料治理
資料治理是一套管理程序與政策,確保資料品質、安全性與合規性,使其能有效支援業務決策與運營。隨著企業從多種來源大規模蒐集資料,只有在資料達到高完整性與標準化時,才能真正發揮價值。
為什麼資料管理很重要
過去,資料治理常被用來封鎖資料孤島,以防止資料洩露或濫用。然而,資料孤島卻使合法使用者在存取所需資料時面臨障礙,無意間抑制了數據驅動創新的發展。
根據 MIT CDOIQ 在 2024 年對 350 名資料長及其同級職位進行的調查,45% 的資料長將資料治理列為首要任務。他們的目標是建立資料治理框架,既能確保資料安全,也能在需要時將資料提供給適合的人員和應用程式。
圖/資料治理是一套管理程序與政策,確保資料品質、安全性與合規性,使其能有效支援業務決策與運營。
Amazon DataZone 打造一站式資料管理
AWS 去年(2024年)正式宣佈,Amazon DataZone 現已支援管理 AWS 機器學習(ML)服務 Amazon SageMaker 中的資料。
Amazon DataZone 是一項資料管理服務,可讓客戶更快、更輕鬆記載、探索、共用和管控儲存在 AWS、內部部署與第三方來源之間的資料。由於 Amazon SageMaker 涉及大量且不一樣格式的數據,通常需要自訂工作流程並整合多種工具來確保數據治理的完整性。
透過 Amazon SageMaker 與 Amazon DataZone 的全新內建整合,企業可大幅簡化機器學習資料的管理流程。使用者僅需數次點擊,即可輕鬆設定跨基礎設施的 機器學習資料治理機制,提升資料存取與使用的靈活性,促進跨部門協作,同時確保機器學習資產的高效管理與合規性,加速業務決策與模型部署。
圖 / Amazon SageMaker 現已與 Amazon DataZone 集成,以簡化機器學習治理 。
透過這項整合,機器學習管理員在部署 Amazon SageMaker 基礎設施時,可運用 Amazon Virtual Private Cloud (VPC)、Amazon Key Management Service (KMS)、以及 AWS Identity and Access Management (IAM) 的控制項,建立 Amazon SageMaker 環境設定檔。
這些設定檔可供機器學習開發者能夠在幾分鐘內快數部署 Amazon SageMaker 網域,無需手動配置基礎設施,大幅提升開發效率,還能與 Amazon DataZone 的資料治理與存取控制機制無縫整合,開發者能夠更輕鬆地搜尋、存取和共享機器學習資產,確保環境符合企業的安全性和合規性要求,加速機器學習工作負載的落地與運行。
圖 /開發者可快速部署 Amazon SageMaker 網域,並與 Amazon DataZone 的資料治理與存取控制機制無縫整合。
Amazon DataZone 三項設定一次搞定!
在 AWS 環境中,Amazon DataZone 讓組織能夠高效管理與治理資料資產。只需完成三個關鍵設定,即可快速啟用 DataZone,確保數據存取安全、資源整合順暢,並提高資料管理效率。
一、設定使用者權限
進入 Amazon DataZone 控制台,點擊 「使用者管理(User Management)」,開始配置存取權限。在 DataZone 中,使用者可被指派不同的角色,如 「管理員(Admin)」、「數據使用者(Data Consumer)」 或 「數據提供者(Data Producer)」,確保適當的存取控制。
二、整合 AWS 資料來源
在 DataZone 控制台,前往 「資料來源(Data Sources)」,點擊 「新增資料來源(Add Data Source)」,然後選擇 AWS 內部或外部的數據存放位置。DataZone 支援與 Amazon S3、AWS Glue、Amazon Redshift 等服務無縫整合,使數據治理更加簡便。
三、管理資料目錄
在 DataZone 控制台,前往 「業務目錄(Business Catalog)」,點擊 「新增資產(Add Asset)」,即可將整合的數據資產發佈到企業內部目錄,方便團隊成員發現與使用。
-
建立分類標籤:為每個數據資產添加 標籤(Tags) 或 分類(Categories),例如「機器學習訓練數據」、「財務報表」、「ETL 處理結果」,幫助用戶更快找到需要的數據。
-
發佈數據資產:當數據經過驗證與標註後,點擊 「發佈(Publish)」,讓組織內的其他成員可以訂閱並使用該資產。
-
訂閱審批流程:當使用者請求存取某個數據資產時,管理員可透過 「訂閱請求(Subscription Requests)」 介面進行審批,確保敏感數據不會被未經授權的用戶存取。
圖 / Amazon SageMaker 現已與 Amazon DataZone 集成,以簡化機器學習治理。
在 AI 驅動的時代,資料治理始終是企業關注的核心課題。企業不僅要確保使用者能夠高效存取資料,還必須維持其安全性與可靠性。隨著技術演進,資料存取與控制的平衡方式也不斷優化。AWS 提供的 Amazon DataZone 與 Amazon SageMaker 整合,讓組織能簡化基礎設施管理,同時強化資料存取與權限控制,確保資料治理符合企業需求。
銓鍇國際 CKmates 深耕企業數位轉型,針對 AI、大數據 等應用場景,提供完善的企業資料治理解決方案,透過雲端架構與工具提升運營效率,降低營運成本,加速企業數位升級!