ETLとは?Extract(抽出) Transform(変換) Load(格納)
ETLの概要
ETLとはExtract(抽出) Transform(変換) Load(格納) の略であり、データベースのデータを適切なフォーマットに変換することによりDWHに書きだす課程のことをいいます。
ETL処理をしないとフォーマットや情報元となるデータベースなどがばらばらになっており、DWHに書きだすことができません。
ETLの利点
Hadoopに対応
Hadoop環境において、データを加工するのは相当な知識や技術が必要です。しかしETLツールを使うことにより、Hadoop環境でもデータの加工がしやすくなります。
OracleやMySQLに接続
ETLツールによりますが、多くのETLツールがOracleやMySQLなどの代表的なデータベースに対応しています。
色々なファイルからデータを読み取れる
テキストファイルやExcelからもデータを読み取ることができます。
マッチング
さまざまなデータベースから抽出したデータを結合することができます。
データ出力
テキストファイルやExcelなど、さまざまな種類のファイルに抽出したデータ出力可能です。
メール送信
データを添付したメールを送信することができます。
関連記事
AWS Glueとは?ELT(抽出・変換・書き込み)
AWS Data Exchangeとは?データをサブスクリプション方式で使用