このソリューションでは、Amazon Simple Storage Service (Amazon S3)、Amazon Redshift、Amazon Kinesis、Amazon Athena、AWS Glue、Amazon Elasticsearch Service (Amazon ES)、Amazon SageMaker、Amazon QuickSight などの Amazon Web Services (AWS) のサービスと統合するデータレイクの基盤をデプロイします。
データレイクの基盤では、これらの AWS のサービスを使用し、データ送信、取り込み処理、データセット管理、データ変換と分析、機械学習ツールの構築とデプロイ、検索、公開、可視化などの機能を提供します。この基盤が設けられると、ISV および SaaS ツールを使用してデータレイクを強化できるようになります。
このリファレンスアーキテクチャは AWS CloudFormation テンプレートによって自動化され、このテンプレートは要件を満たすようにカスタマイズできます。
このソリューションは AWS によって開発されました。
-
構築するもの
-
デプロイ方法
-
コストとライセンス
-
リソース
-
構築するもの
-
このソリューションでは次を設定します。
- 2 つのアベイラビリティーゾーンにまたがり、2 つのパブリックサブネットと 2 つのプライベートサブネットを含む仮想プライベートクラウド (VPC)。*
- インターネットへのアクセスを提供するインターネットゲートウェイ。*
- パブリックサブネットに配置される、マネージド NAT ゲートウェイ。プライベートサブネット内のリソースへのアウトバウンドのインターネットアクセスを提供します。*
- パブリックサブネットの Auto Scaling グループに含まれる Linux 踏み台ホスト。パブリックサブネットおよびプライベートサブネット内の EC2 インスタンスへのインバウンドのセキュアシェル (SSH) アクセスを許可します。*
- AWS リソースへのアクセス許可を提供する AWS Identity and Access Management (IAM) ロール。例えば、キュレートされたデータセットに対して Amazon Redshift と Amazon Athena から読み書きできるようになります。
- プライベートサブネットに配置される、データ集約、分析、変換、新規にキュレートおよび公開されるデータセットの作成のための Amazon Redshift。
- AWS 認証を使用してアクセスできる Amazon SageMaker インスタンス。
- Amazon S3、Amazon Athena、AWS Glue、AWS Lambda、Amazon ES with Kibana、Amazon Kinesis、Amazon QuickSight など、他の Amazon サービスとの統合。
* ソリューションを既存の VPC にデプロイするテンプレートは、アスタリスクが付けられたタスクをスキップし、既存の VPC 設定にユーザーを誘導します。
-
デプロイ方法
-
デプロイガイドの指示に従って、このソリューションをデプロイします。これにはこれらのステップが含まれます。
- AWS アカウントにサインインします。AWS アカウントをお持ちでない場合は、https://aws.amazon.com でサインアップしてください。
- ソリューションを起動します。スタックのデプロイには、約 50 分かかります。スタックを作成する前に、上部のツールバーから AWS リージョンを選択します。以下のいずれかのオプションを選択してください。
- ソリューションで作成したリソースを確認してデプロイをテストします。
ソリューションにはカスタマイズ可能なパラメータが用意されています。例えば、ネットワークを設定したり、Amazon Redshift、Kinesis、Elasticsearch の設定をカスタマイズしたりできます。
Amazon は、本ソリューションで AWS と協力した AWS パートナーとユーザーデプロイ情報を共有する場合があります。
-
コストとライセンス
-
このソリューションの実行中に使用した AWS のサービスおよびサードパーティーライセンスのコストは、お客様のご負担となります。このソリューションを使用しても追加コストは発生しません。
このソリューションには、カスタマイズ可能な設定パラメータが含まれています。インスタンスタイプなどの設定の一部は、デプロイにかかるコストに影響します。料金の見積もりについては、利用する AWS の各サービスの料金ページを参照してください。料金は変更される場合があります。
ヒント: ソリューションをデプロイした後、 AWS Cost and Usage Report を作成し、関連するコストを追跡します。これらのレポートは、お客様のアカウントでの Amazon Simple Storage Service (Amazon S3) バケットへの請求メトリクスを提供します。毎月の使用量に基づいてコストを見積もり、月末のデータを集計します。詳細については、 AWS Cost and Usage Report とはを参照してください。
-
リソース
-
このソリューションは、ソリューションスペースで紹介されているソリューションに関連しています。これには、概要、AWS コンピテンシーパートナーが作成したコンサルティングオファーのオプション、概念実証 (PoC) プロジェクトでの AWS の共同投資が含まれます。詳細については、ソリューションスペースを参照してください。