AWS Data Exchangeとは?データをサブスクリプション方式で使用

AWS Data Exchangeの概要

AWS Data Exchangeとは、AWSで世界中に大量に存在するさまざまなサードパーティデータをサブスクリプション方式で使用できるようにするサービスです。

AWSのクラウドでは世界に大量にある多種多様なデータを収集するために、時事、経済、メディア、エンターテインメント、金融、ヘルスケア、世界中の有名なデータプロバイダーを認定データプロバイダーとして認定しています。

認定データプロバイダーの代表的な企業は以下になります。

Reuters

Reutersは、世界中のニュースや話題を数多くの言語で発信する企業です。

Change Healthcare

ヘルスケア事業関連のデータを保有する企業です。

Dun& Bradstreet

世界規模のビジネス関連データを保有し分析を実施する企業です。

Foursquare

消費者の位置情報を保有し、ソーシャル・ネットワーキング・サービス事業を展開する企業です。

AWS Data Exchangeを使用することで、認定プロバイダーは保有する最新にデータを簡単に検索してチョイスし、Amazon S3に取り込んで、AWSの多種多様な分析や機械学習サービスを使って分析することができます。

利点

世界中の多種多様なデータを簡単に収集できる

AWS Data Exchangeを活用することで、AWSの認定データプロバイダーから世界中の多種多様な最新データを簡単に収集することが可能になります。認定データプロバ イ ダ ー に は 、 前 述 のReuters、Change Healthcare、Dun&Bradstreet、Foursquareなどの企業のほかにも、Virtusa、TransUnion、PitneyBowes、TPICAP、Vortexa、IMDb、Epsilon、Enigma、TruFactor、ADP、CompagnieFinancière Tradition、Verisk、Crux Informatics、TSX Inc、 Acxiom、Rearcなど、80を超える企業があります。

また、試用版や無料のデータセットの提案があるので、サブスクリプション方式で使用する前に検討することも可能です。さらに、データプロバイダーがデータを更新した場合は通知が届くため、最新のデータを取得できます。

データ取得のための面倒な作業が省ける

企業がデータを使用するには、まずデータ元を検索したり、ライセンス取得、分析のためのデータ移動など、いくつかの面倒な作業が発生します。また、複数のデータプロバイダーからデータを取得する場合は、それぞれのプロバイダーに対して対応が必要となります。AWS Data Exchangeを使用すると、データ取得のための面倒な作業を省き、迅速に分析作業に入れます。

AWSの多種多様な分析や機械学習サービスを使って分析することができる

AWS Data Exchangeでは、取得したデータをAWSのAmazon S3に取り込んで、AWSの多種多様な分析や機械学習サービスを使って簡単に使用・分析することができます。たとえば以下の作業などが迅速に実行できます。

Amazon EMR:ビッグデータ処理

Amazon Redshift:データウェアハウス

Amazon Athena:アドホッククエリ

AWS Glue:データ統合、ETL

AWS Lake Formation:データレイクの構築

参考資料
https://aws.amazon.com/jp/data-exchange/