Amazon Elastic Inferenceの概要とメリット
Amazon Elastic Inferenceの概要
Amazon Elastic InferenceとはAmazon EC2 、Sagemaker インスタンス、Amazon ECSタスクに低コストのGPUアクセラレーションをアタッチできるコンピューティングサービスです。Amazon Elastic Inferenceをアタッチさせることで、ディープラーニングの推論プロセスにかかるコストを最大75%まで削減できます。
Amazon Elastic Inferenceがサポートしているモデルは、TensorFlow、Apache MXNet、PyTorch、ONNX モデルと多岐に渡ります。
Amazon Elastic Inferenceの利点
Amazon Elastic Inferenceの利点には以下の点があげられます。
- 推論コストを最大75%削減
- Amazon SageMaker、Amazon EC2 、Amazon ECS との統合
推論コストを最大75%削減
Amazon Elastic Inferenceは、自社の求めているものに適したインスタンスタイプを選択でき、選択後に必要な推論アクセラレーションを個別設定ができます。
そのため適切なリソースで運用ができるので、最大75%の推論コストの削減につながります。
Amazon SageMaker、Amazon EC2 、Amazon ECS との統合
Amazon Elastic Inferenceでは、Amazon SageMakerに装備しマネージドを行う方法や、Amazon EC2 インスタンス、Amazon ECSタスクを利用して自身で管理する方法があります。Amazon Elastic Inferenceはこれらと簡単に統合が可能です。
Amazon Elastic Inferenceのまとめ
Amazon Elastic Inferenceを利用することで、ディープラーニングをより加速させます。コストの削減に加え、自社にとって必要な推論アクセラレーションを設定できるので、よりよい環境になるでしょう。
参考資料
https://aws.amazon.com/jp/machine-learning/elastic-inference/