AWS Data Exchangeとは?データをサブスクリプション方式で使用
AWS Data Exchangeの概要
AWS Data Exchangeとは、AWSで世界中に大量に存在するさまざまなサードパーティデータをサブスクリプション方式で使用できるようにするサービスです。
AWSのクラウドでは世界に大量にある多種多様なデータを収集するために、時事、経済、メディア、エンターテインメント、金融、ヘルスケア、世界中の有名なデータプロバイダーを認定データプロバイダーとして認定しています。
認定データプロバイダーの代表的な企業は以下になります。
Reuters
Reutersは、世界中のニュースや話題を数多くの言語で発信する企業です。
Change Healthcare
ヘルスケア事業関連のデータを保有する企業です。
Dun& Bradstreet
世界規模のビジネス関連データを保有し分析を実施する企業です。
Foursquare
消費者の位置情報を保有し、ソーシャル・ネットワーキング・サービス事業を展開する企業です。
AWS Data Exchangeを使用することで、認定プロバイダーは保有する最新にデータを簡単に検索してチョイスし、Amazon S3に取り込んで、AWSの多種多様な分析や機械学習サービスを使って分析することができます。
利点
世界中の多種多様なデータを簡単に収集できる
AWS Data Exchangeを活用することで、AWSの認定データプロバイダーから世界中の多種多様な最新データを簡単に収集することが可能になります。認定データプロバ イ ダ ー に は 、 前 述 のReuters、Change Healthcare、Dun&Bradstreet、Foursquareなどの企業のほかにも、Virtusa、TransUnion、PitneyBowes、TPICAP、Vortexa、IMDb、Epsilon、Enigma、TruFactor、ADP、CompagnieFinancière Tradition、Verisk、Crux Informatics、TSX Inc、 Acxiom、Rearcなど、80を超える企業があります。
また、試用版や無料のデータセットの提案があるので、サブスクリプション方式で使用する前に検討することも可能です。さらに、データプロバイダーがデータを更新した場合は通知が届くため、最新のデータを取得できます。
データ取得のための面倒な作業が省ける
企業がデータを使用するには、まずデータ元を検索したり、ライセンス取得、分析のためのデータ移動など、いくつかの面倒な作業が発生します。また、複数のデータプロバイダーからデータを取得する場合は、それぞれのプロバイダーに対して対応が必要となります。AWS Data Exchangeを使用すると、データ取得のための面倒な作業を省き、迅速に分析作業に入れます。
AWSの多種多様な分析や機械学習サービスを使って分析することができる
AWS Data Exchangeでは、取得したデータをAWSのAmazon S3に取り込んで、AWSの多種多様な分析や機械学習サービスを使って簡単に使用・分析することができます。たとえば以下の作業などが迅速に実行できます。
Amazon Redshift:データウェアハウス
Amazon Athena:アドホッククエリ
AWS Lake Formation:データレイクの構築