Azure Databricksとは?概要とメリットを解説
Azure Databricksの概要
Azure Databricksは、Microsoft社が提供しているデータ分析プラットフォームです。
Databricksの高度なデータ分析環境をAzureのクラウドに最適化しています。好みの言語とツールを活用してデータにアクセスし、新たな分析情報を共有可能です。
オープンソースのフレームワークであるApache Sparkの分散処理をベースとしており、ビッグデータを分析するのに役立ちます。Azure Machine Learningと呼ばれる機械学習用サービスと連携すれば、機械学習モデルの管理から更新まで実行することも可能です。
データエンジニアや機械学習エンジニアなどの各専門家が連携できるように、対話が可能なワークスペースも用意されています。
Azure Databricksのメリット
Azure Databricksでは、Azure Machine Learningで提供されるAPI(統合ツール)によって、データ統合サービスであるAzure Data Factoryや大規模なデータを取り込めるAzure Data Lake Storageなどと連携できます。
Azure Data Factoryでデータの取得・移動・変換を自動化して、Azure Data Lake Storageにデータを読み込ませて分析可能です。さらにダッシュボードを利用すれば、分析結果を視覚化できます。
▼参考資料