Amazon CloudSearch を無料でお試し
CloudSearch の無料トライアルを開始する詳細はこちら
機能制限なしの検索インスタンスを 750 時間分、30 日間無料でご利用いただけます。開始するには次の手順に従ってください。
AWS アカウントにサインインして、CloudSearch コンソールを起動します。
数回のクリックで、検索ドメインの作成と設定を行います。
データをアップロードし、コンソール、AWS SDK、または CLI で検索 / 更新リクエストを送信します。
Q: Amazon CloudSearch とは何ですか?
Amazon CloudSearch は、AWS クラウドの完全管理型サービスです。ウェブサイトやアプリケーションに合わせて検索ソリューションを簡単に設定、管理、拡張できます。
Q: EC2 上で独自の検索サービスを実行するのではなく、Amazon CloudSearch のようなマネージド型検索サービスを実行する利点は何ですか?
Amazon CloudSearch には、簡単な構成、データとトラフィックに合わせた自動スケーリング、クラスターの自己修復、マルチ AZ での高可用性など、独自の検索サービスを実行する場合と比べてメリットがいくつもあります。AWS マネジメントコンソールで数回クリックするだけで、検索ドメインを作成して検索対象にするデータをアップロードでき、Amazon CloudSearch が自動的に必要なリソースを提供して高度に調整された検索インデックスをデプロイします。
Q: 検索エンジンとは何ですか?
検索エンジンは、大部分がテキストで構成された大きな一連のデータ項目(ドキュメント)を検索し、最も一致する結果をすばやく見つけることを可能にします。検索リクエストは通常、「マット デーモン 映画」などの非構造化テキストです。返される結果は通常、一致度または適切度によってランク付けされ、検索語に最も関連しているものが最初に表示されます。
ドキュメントはまったく構造化されていない場合があり、個別に検索できる複数のフィールドが含まれている可能性があります。例えば、映画の検索サービスでは、タイトル、監督名、俳優名、説明、レビューのフィールドを持つドキュメントがあります。検索エンジンが返す結果は、その元となっているドキュメント(特定のウェブページを参照する URL など)のプロキシが一般的です。ただし、検索サービスは個別のフィールドの実際の内容を返すこともあります。
Q: Amazon CloudSearch のメリットは何ですか?
Amazon CloudSearch は完全に管理された検索サービスであり、データ容量と検索リクエストの複雑度によって自動的に縮小または拡張し、高速で正確な結果を返します。Amazon CloudSearch により、お客様はホスト、トラフィック、データの縮小や拡張、冗長性、およびソフトウェアパッケージを管理する必要なく検索することができます。ユーザーは、使用したリソース分のみ低額の料金を使用時間に応じて支払います。Amazon CloudSearch では、独自の検索環境を運用管理するのに比べると、総所有コストを大幅に削減できます。
Q: Amazon CloudSearch とストレージサービスを一緒に使用することはできますか?
検索サービスとストレージサービスはお互いを補完するものです。検索サービスでは、ファイルシステム内のファイル、Amazon S3 のデータ、または Amazon DynamoDB や Amazon RDS インスタンスのレコードとして、ドキュメントがあらかじめどこかに保存されている必要があります。検索サービスは、インデックス作成というプロセスによって秒速でこれらの項目を検索可能にする、高速なデータ取り出しシステムです。
Q: Amazon CloudSearch とデータベースを一緒に使用することはできますか?
検索エンジンやデータベースはお互いを排除するものではありません。併せて使用されることがよくあります。構造化データを含むデータベースを既に持っている場合は、検索エンジンを利用し、検索語を適切な条件として使用して、データベースのコンテンツを正確にフィルタリングおよびランク付けすることをお勧めします。
検索サービスは、構造化データおよび非構造化データの両方を検索するのに使用できます。コンテンツは複数のソースからのものである可能性があり、データベースフィールドだけでなく、多様な形式のファイル、ウェブページなどを含む場合があります。検索サービスはカスタマイズ可能な結果のランク付けや、データベースで使用できないフィルタリングのファセットを使用するなどの特別な検索機能をサポートできます。
Q: Amazon CloudSearch は、どのリージョンで利用できますか?
Amazon CloudSearch は米国東部 (バージニア北部)、米国西部 (オレゴン)、米国西部 (北カリフォルニア)、欧州 (アイルランド)、欧州 (フランクフルト)、南米 (サンパウロ)、アジアパシフィック (シンガポール、東京、シドニー、およびソウル) の AWS リージョンでご利用いただけます。
Q: 最新の CloudSearch インスタンスタイプとは何ですか?
2021 年 1 月に、AWS は古いインスタンスを置き換える新しい CloudSearch インスタンスタイプをリリースしました。最新の CloudSearch インスタンスは、search.small、search.medium、search.large、search.xlarge、および search.2xlarge で、既存のインスタンスを 1 対 1 で置き換えます。 例えば、search.small は search.m1.small を置き換えます。新しいインスタンスは、その下にある最新世代の EC2 インスタンスタイプを活用するため、同じ料金でより優れた可用性とパフォーマンスを実現します。
Q: ドメインを新しいインスタンスに更新するにはどうすればよいですか?
AWS がドメインを新しいインスタンスにシームレスに自動的に移動させます。お客様からのアクションは必要ありません。この移行は、2013 年バージョンの CloudSearch にあるドメインから始めて、今後数週間にわたって段階的に行っていきます。ドメインが新しいインスタンスタイプに更新されると、コンソールに通知が表示されます。作成する新しいドメインは、自動的に新しいインスタンスを使い始めます。移行についてご質問がある場合は、AWS サポートにお問い合わせください。
Q: 新しいインスタンスになることで追加費用は発生しますか?
いいえ。これらのインスタンスの料金は、以前に使用していた、または現在使用しているインスタンスと同じで、可用性とパフォーマンスが向上しています。
Q: 私のドメインは search.m2.2xlarge などの前世代の CloudSearch インスタンスを実行しています。ドメインは移行しますか?
はい。ドメインは、移行の後続のフェーズで同等の新しいインスタンスに移行します。例えば、search.m2.2xlarge は search.previousgeneration.2xlarge に更新されます。これらのインスタンスの料金は既存のインスタンスと同じで、ドメインの安定性が向上します。
Q: Amazon CloudSearch がサポートする新機能には、どのようなものがありますか。
Amazon CloudSearch の最新リリースでは、いくつかの新しい検索と管理の機能がサポートされます。主な新機能は、次のとおりです。
- 言語のサポート:
- 34 の言語、および混合している言語を処理する「Multiple」オプション
- フィールドごとの言語設定
- 言語固有のテキスト分析
- 多くの言語について、「なし」を含む複数レベルのアルゴリズムステミングが可能
- 強化された検索機能:
- 候補
- ハイライト
- 地理空間検索
- 新しいデータ型(日付型、倍精度浮動小数点型、64 ビット符号付整数型、LatLon 型)
- あいまいフレーズ検索
- 用語の増強
- すべてのフィールド型の高度な範囲検索
- 複数のクエリパーサーのサポート(simple、structured、lucene、dismax)
- クエリパーサーの設定オプション
- 管理機能:
- 高可用性オプション
- IAM 統合
- ユーザー設定可能なスケーリング
- 高可用性オプション
- 次の AWS リージョンでも利用できるようになりました。アジアパシフィック (東京)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (ソウル)、南米 (サンパウロ)
Q: Amazon CloudSearch では辞書ステミングは引き続きサポートされますか。
はい。新しいバージョンの Amazon CloudSearch は、辞書ステミングとアルゴリズムステミングをサポートします。
Q: 新しいバージョンの Amazon CloudSearch は Apache Solr を使用しますか。
はい。Amazon CloudSearch の最新バージョンでは、基盤となるテキスト検索エンジンとして Apache Solr を使用するように変更されました。Amazon CloudSearch には、Apache Solr で使用できるいくつかの一般的な検索エンジン機能が用意されました。また、検索ドメインのセットアップ、運用、拡大/縮小を補助するマネージド型検索サービス環境も利用できます。
Q: 新しいバージョンの Amazon CloudSearch にコンソールからアクセスできますか。
はい。新しいバージョンの Amazon CloudSearch にコンソールからアクセスできます。現在、既存の検索ドメインがある Amazon CloudSearch をご利用のお客様は、新規に検索ドメインを作成する際にどのバージョンの Amazon CloudSearch を使用するかを選択できます。新規のお客様はデフォルトで Amazon CloudSearch の新しいバージョンを使用することになり、2011-01-01 バージョンにはアクセスできません。
Q: 新しいバージョンの Amazon CloudSearch がサポートするデータ型にはどのようなものがありますか。
Amazon CloudSearch はテキストとリテラルの 2 つの型のテキストフィールドをサポートしています。テキストフィールドは、フィールドに設定された言語に従って処理され、これにより、クエリの一致条件として使用される個々の単語が決まります。リテラルフィールドは処理されず、大文字小文字を含めて、正確に一致している必要があります。CloudSearch は、整数、倍精度浮動小数点、日付、LatLon の 4 つの数値型もサポートしています。整数型フィールドは 64 ビットの符号付き値を保持します。倍精度浮動小数点型フィールドは、2 倍の長さの浮動小数点値を保持します。日付型フィールドは、IETF RFC3339: yyyy-mm-ddT00:00:00Z に従って、UTC(協定世界時間)で指定された日付を保持します。LatLon 型フィールドには緯度と経度の値のペアで位置が格納されます。
Q: 2011-02-01 のバージョンの Amazon CloudSearch で作成された既存の検索ドメインは引き続き機能しますか?
はい。2011-02-01 のバージョンの Amazon CloudSearch で作成された既存の検索ドメインは引き続き機能します。
Q: 2011-01-01 バージョンの Amazon CloudSearch で作成した既存の検索ドメインで新しい機能を使用できますか?
2011-01-01 バージョンの Amazon CloudSearch で作成された既存の検索ドメインは、新しいバージョンで使用できるようになった機能にアクセスできません。新しい機能にアクセスするには、2013-01-01 バージョンの Amazon CloudSearch を使用して、新しい検索ドメインを作成する必要があります。
Q: 2011-01-01 バージョンの Amazon CloudSearch を使用して構築したアプリケーションを新しいバージョンの Amazon CloudSearch に移行するにはどうすればよいですか?
新しいバージョンの Amazon CloudSearch を使用するには、新しいバージョンの Amazon CloudSearch を使用して既存のドメインを再作成し、データを再アップロードする必要があります。詳細については、Amazon CloudSearch 開発者ガイドの「Migrating to the 2013-01-01 API」を参照してください。
Q: AWS は引き続き 2011-02-01 バージョンの Amazon CloudSearch をサポートしますか?
はい。AWS は引き続き 2011-02-01 バージョンの Amazon CloudSearch をサポートします。
Q: 2011-02-01 バージョンの Amazon CloudSearch を使用して新規検索ドメインを作成できますか?
既存の 2011-02-01 ドメインをお持ちの Amazon CloudSearch の現在のお客様は、2011-02-01 API または新しい 2013-01-01 API のどちらを新しいドメインに使用するかを選択することができます。新規のお客様が検索ドメインを作成すると、自動的に 2013-01-01 API で作成されます。
Q: 新しいバージョンの Amazon CloudSearch の無料トライアルを利用することはできますか?
新規のお客様は引き続き Amazon CloudSearch の無料トライアルをご利用いただけます。詳しくは、Amazon CloudSearch の無料トライアルページを参照してください。
Q: Amazon CloudSearch はどのように利用を開始できますか?
Amazon CloudSearch にサインアップするには、Amazon CloudSearch の詳細ページで [今すぐ無料でお試し] ボタンをクリックしてサインアップのプロセスを完了します。Amazon Web Services アカウントが必要です。アカウントをまだお持ちでない場合は、Amazon CloudSearch サインアッププロセスを開始すると、AWS アカウントを作成することができます。
サインアップが完了したら、AWS Management Console から [Amazon CloudSearch] を選択します。Amazon CloudSearch コンソールを使用すると、検索ドメインをすばやく作成し、検索フィールドを構成し、サンプルデータをアップロードし、検索ドメインに検索クエリを送信することができます。AWS SDK および CLI を使用して、これらの操作を実行することもできます。
詳細については、Amazon CloudSearch 開発者ガイドの「Getting Started」をご覧ください。
Q: AWS SDK は Amazon CloudSearch をサポートしますか?
はい、Java、Ruby、Python、.Net、PHP、および Node.js 対応の AWS SDK は CloudSearch をサポートします。AWS SDK を使用すると、検索ドメインをすばやく作成し、検索フィールドを構成し、データをアップロードし、検索ドメインに検索クエリを送信できます。
Q: AWS CLI は Amazon CloudSearch をサポートしますか?
はい、AWS CLI は CloudSearch をサポートします。AWS CLI を使用すると、検索ドメインをすばやく作成し、検索フィールドを構成し、データをアップロードし、検索ドメインに検索クエリを送信できます。
Q: Amazon CloudSearch CLT はまだ使用できますか?
はい、Amazon CloudSearch CLT は引き続き使用できます。
Q: 検索ドメインとは何ですか? 検索ドメインはどのように作成できますか?
検索ドメインとはデータコンテナと、データを検索可能にするサービスのセットです。これらのサービスには、次のものが含まれます。
- インデックス作成のためにドメインにデータをアップロードできるようにするドキュメントサービス。
- インデックス作成されたデータに対して検索リクエストを実行できるようにする検索サービス。
- ドメインの動作をコントロールする構成サービス(適切度のランク付けを含む)。
AWS マネジメントコンソール、AWS SDK、または AWS CLI を使用して、検索ドメインを作成、管理、および削除できます。
Q: ドキュメントはどのように検索ドメインにアップロードできますか?
AWS マネジメントコンソール、AWS SDK、または AWS CLI を使用して、ドメインにドキュメントをアップロードします。
Q: ドキュメントは特定の形式にしておく必要がありますか?
データを検索できるようにするには、データを JSON または XML でフォーマットする必要があります。 検索結果として返せるようにする各項目がドキュメントとして示されます。各ドキュメントには固有のドキュメント ID、および検索し、結果を返すデータを含むフィールドが 1 つ以上あります。Amazon CloudSearch は、ドメイン用に構成されたインデックスフィールドに基づいて、ドキュメントデータから検索インデックスを生成します。データが変更されたら、更新を送信して、インデックスにドキュメントを追加またはインデックスからドキュメントを削除します。
Q: Amazon CloudSearch 用にフォーマットされたドキュメントバッチはどのように作成すればよいですか。
データを記述するドキュメントバッチを作成するには、以下の内容を指定する JSON または XML のテキストファイルを作成します。
- 操作種別: 追加または削除
- 一意の識別子
- 実際のフィールドとデータ
次の例では、JSON でフォーマットされた 1 つのドキュメントバッチを示します。
[
{
"fields" : {
"directors" : [
"Francis Lawrence"
],
"release_date" : "2013-11-11T00:00:00Z",
"genres" : [
"Action",
"Adventure",
"Sci-Fi",
"Thriller"
],
"image_url" : "http://ia.media-imdb.com/images/M/MV5xMzzAx._V1_SX400_.jpg"
"plot" : "Katniss Everdeen and Peeta Mellark become targets of the Capitol after their victory in the 74th Hunger Games sparks a rebellion in the Districts of Panem.",
"title" : "The Hunger Games: Catching Fire",
"rank" : 4,
"running_time_secs" : 8760,
"actors" : [
"Jennifer Lawrence",
"Josh Hutcherson",
"Liam Hemsworth"
],
"year" : 2013
},
"id" : "tt1951264",
"type": "add"
}
]
年などの整数値は引用符で囲まれず、ジャンルなど複数の値を持つフィールドの値は JSON の配列で示される点に注意してください。
このデータを Amazon CloudSearch で利用できるようにするには、データをファイルに保存し、AWS マネジメントコンソール、AWS SDK、または AWS CLI を使用して、このファイルをアップロードします。
Q: ドキュメントのインデックスはどのように作成されますか?
ドキュメントのインデックスは、検索ドメインにアップロードされる際に自動的に作成されます。また、IndexDocuments リクエストを送信して構成を変更する際に明示的にドキュメントのインデックスを再作成することもできます。
Q: ドメインのインデックスは、どのような場合に再作成する必要がありますか?
新しいインデックスフィールドの追加やステミングまたはストップワードディクショナリーの更新といった特定の構成オプションは、ドメインのインデックスを再作成するまで使用できません。インデックスの作成を必要とする変更を行った場合は、ドメインのステータスは、インデックスの作成が必要であることを示します。AWS マネジメントコンソール、AWS SDK、または AWS CLI からインデックスの作成を開始できます。
Q: 検索ドメインにどのように検索リクエストを送信できますか?
検索ドメインにはそれぞれ、ドキュメントセットの検索結果を受け入れる個別の URL(検索エンドポイント)を持つ REST ベースの検索サービスがあります。AWS マネジメントコンソール、AWS SDK、または AWS CLI から検索リクエストを送信できます。
Q: 検索ドメインを複数のアベイラビリティーゾーンに分散させることはできますか?
はい。マルチ AZ オプションが有効な場合、Amazon CloudSearch は同じリージョン内の 2 番目のアベイラビリティーゾーンに追加のインスタンスをデプロイします。詳細については、Amazon CloudSearch 開発者ガイドの「Configuring Availability Options」を参照してください。
Q: 検索ドメインを別のリージョンに移動することは可能ですか?
現時点では、検索ドメインを別のリージョンに自動的に移行する手段はありません。新しいドメインを移行先のリージョンで作成し、そのドメインを設定してデータをアップロードしてから、元のドメインを削除する必要があります。
Q: 検索ドメインを削除するにはどうすればよいですか?
検索ドメインを削除するには、Amazon CloudSearch コンソールで [Delete Domain] ボタンをクリックします。また、AWS SDK または AWS CLI からドメインを削除することもできます。
Q: 検索ドメインからドキュメントを削除するにはどうすればよいですか?
ドキュメントを削除するには、削除するドキュメントの ID を含むバッチアップロードに削除操作を指定します。
AWS マネジメントコンソール、AWS SDK、または AWS CLI からデータ更新を提出できます。
Q: 検索ドメインを空にするにはどすればよいですか?
ドメインのエンドポイントを維持する場合は、ドメイン内の各ドキュメントに対して削除を送信します。
Q: ドメインが「PROCESSING」状態になっているのはなぜですか?
ドメインの状態は、「PROCESSING」、「ACTIVE」、または「REINDEXING」の 3 種類のうちいずれかになります。 通常、ドメインの状態は「ACTIVE」です。これは、現時点で変更が行われておらず、ドメインに対してクエリや更新を行うことができ、現時点でそれまでのすべての変更を検索結果で確認できることを表します。
ドメインでインデックスの再作成が必要な場合、Amazon CloudSearch ではインデックス全体を再構築する必要があります。ただし、インデックスの再作成を開始するまでは、ドメインは「PROCESSING」状態になりません。この段階では、ドメインに対しては依然としてクエリや更新を実行できますが、インデックスの作成が完了してドメインの状態が「ACTIVE」に戻るまで、検索結果で設定変更を確認できません。
また、ドメインにドキュメントバッチを引き続きアップロードすることも可能です。ただし、ドメインが「PROCESSING」状態の間に大量の更新を送信した場合、更新が検索インデックスに適用されるまでの時間が長くなることがあります。これが問題になる場合は、ドメインが「ACTIVE」状態に戻るまで、更新のペースを下げてください。
Q: CloudSearch にデータをブートストラップする際のベストプラクティスを教えてください。
ドメインを起動したら、次のステップは Amazon CloudSearch にデータを読み込むことです。おそらく、単一の大規模なデータセットをアップロードした後、新しいデータが得られたときに比較的小規模の更新や追加を行う必要があります。以下のガイドラインは、CloudSearch への初期データのブートストラップを迅速かつ簡単に行うのに役立ちます。
1.スクリプトを準備するときに curl -v コマンドラインツールを使用する
データセットのアップロード時に、作成したスクリプトがデータを読み取り、それを使用して JSON または XML ドキュメントを作成します。このスクリプトを事前に準備し、curl や別のシンプルなコマンドラインツールを使用して、スクリプトで作成されるドキュメントをアップロードできるかどうかを確認することをお勧めします。curl で「-v」オプションを使用すると、多くの場合、AWS SDK や Boto(いずれも本番稼働用にエラーを抑制する)よりも詳細な、構文の問題に関する情報が得られます。curl ではより詳細なエラーメッセージが表示されるため、問題がある場合、その原因の特定に役立ちます。
2.UTF-8 文字コードを使用する
すべてのデータが UTF-8 文字コード形式になっており、CloudSearch へのアップロード前に不適切な Unicode 文字がすべて削除されていることを確認します。無効な文字が含まれていると、ドキュメントのアップロードに失敗します。
3.ドキュメントのバッチ処理を行う
ドキュメントのバッチ処理は、おそらく、データのブートストラップにおける最も重要なステップです。CloudSearch にドキュメントを個別に送信することは、非効率であるのみならず、防ぐことができるようなエラーの発生につながります。
ドキュメントバッチは追加および削除操作のコレクションであり、ドメインで追加、更新、削除するドキュメントを表します。バッチは JSON または XML のいずれかで記述され、ドメインにバッチをアップロードすると、ドメインのインデックス作成オプションに従って、データのインデックスが自動的に作成されます。検索ドメインにアップロードされたドキュメントバッチの総数に対して請求が発生するため、1 回のアップロードで許可される最大サイズである 5 MB のバッチ単位でデータをアップロードするとコスト効率が高くなります。バッチを並行してアップロードして、データをアップロードするのにかかる時間を短縮することもできます。
4.4. 事前スケーリング
CloudSearch へのアップロード前に、データを事前スケーリングすることも重要です。事前スケーリングには、アップロードするデータの量に適したインスタンスタイプの選択が含まれます。
アップロードのサイズを扱えるだけのキャパシティーを備えたインスタンスを選択すると、エラーやレプリケーション数の増加を防ぐことができます。レプリケーションは検索の応答時間の短縮に役立ちますが、データパイプのサイズを増やしたり、データアップロードの基本的な問題に対処したりするものではありません。
送信するデータが増えるに従って、CloudSearch はより大きいインスタンスに自動的にスケールアップします。それでも、インスタンス間のスケーリングは時間がかかる傾向があるため、適切なインスタンスタイプを事前に選択するとその後のブートストラッププロセスで時間を節約できます。以下は、ブートストラップ用にドメインの事前スケーリングを行い、データが読み込まれた後にインスタンスタイプを復元するためのサンプルスクリプトです。
ブートストラップ前の事前スケーリング:
aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m3.2xlarge
aws cloudsearch index-documents --domain-name foo
データの読み込み後の復元:
aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m1.small
aws cloudsearch index-documents --domain-name foo
Q: 504 エラーを回避する方法には、どのようなものがありますか?
504 エラーが表示されるか、レプリケーション数が多くなっている場合は、より大きいインスタンスタイプへの移行を試してみてください。例えば、m3.large で問題が発生している場合は、より大きい m3.xlarge に移行します。事前スケーリングを行った後でも 504 エラーが引き続き発生する場合は、データのバッチ処理を開始し、再試行の間の遅延時間を長くしてください。
Q: ドメインの設定とインデックスの再作成を迅速に行うためのベストプラクティスを教えてください。
検索ドメインの設定オプションを変更する場合、そうした変更を検索結果に適用するには、検索インデックスを再構築する必要があります。インデックスの再構築には、一度に 1 件の設定変更を行う場合でも、一度に複数の設定変更を行う場合でも、30 ~ 60 分かかる可能性があります。ドメインに少数のドキュメントしか含まれていない場合でも、インデックスの構築とその配置に必要な処理やプロビジョニングのために、インデックスの再作成にはこれだけの時間がかかります。そのため、設定変更を事前に計画し、すべての変更を一度に行ってから、ドメインのインデックスの再作成を行ってください。同じことが新しいドメインのセットアップ時にも当てはまります。つまり、セットアップ前に設定を計画することで、インデックスの作成を一度のみ行い、可能な限り短い時間で稼働を開始できるようにしてください。
ドメインの変更には、インデックスの再作成が必要になるものもあれば、既存のインデックスの再デプロイのみで済むものもあります。インデックスの再作成には 30 ~ 60 分かかりますが、ドメインの再デプロイにかかる時間は 10 ~ 15 分です。再デプロイの際、CloudSearch は新しいノードを作成し、インデックスをそれらにデプロイして、古いノードをシャットダウンします。再デプロイの間、ドメインのステータスは「PROCESSING」に変わります。インデックスの再作成が必要な場合、ドメインのステータスは「NEEDS INDEXING」に変わり、その後、インデックスの作成を開始すると「PROCESSING」に変わります。新しいインデックスが作成されると、ドメインは再デプロイされます。次の表は、インデックスの再作成および再デプロイが必要な変更と、再デプロイのみで済む変更をまとめたものです。この表を理解しておくと、設定変更をより適切に計画できます。
変更 |
インデックスの再作成が必要 |
再デプロイが必要 |
マルチ AZ | 無 |
有 |
インデックスフィールド |
有 |
有 |
インデックスフィールドオプション |
有 | 有 |
インスタンスタイプ |
有 | 有 |
パーティション数 |
有 | 有 |
レプリケーション数 |
無 | 有 |
サジェスタ |
有 | 有 |
式 |
無 | 有 |
分析スキーム |
有 | 有 |
Q: Amazon CloudSearch は、どのような検索機能を提供しますか?
Amazon CloudSearch は、構造化データとプレーンテキストの両方について、ファセット検索、フリーテキスト検索、ブール型検索の式、カスタマイズ可能な適切度ランク付け、クエリの時間ランクの式、フィールドの重み付け、任意のフィールドを使用した検索および結果のソート、テキスト処理オプション(トークン化、ストップワード、ステミング、同義語など)といった、インデックス作成と検索の機能を提供します。また、ドキュメント更新時にほぼリアルタイムのインデックス作成も提供します。新機能は次のとおりです。
- 自動入力の候補
- ハイライト
- 地理空間検索
- 新しいデータ型(日付型、倍精度浮動小数点型、64 ビット符号付整数型、LatLon 型)
- 動的フィールド
- インデックスフィールドの統計
- あいまいフレーズ検索
- 用語の増強
- すべてのフィールド型の高度な範囲検索
- 適切度に影響を与えない検索フィルタ
- 複数のクエリパーサーのサポート(simple、structured、lucene、dismax)
- クエリパーサーの設定オプション
Q: ファセットとは何ですか?
ファセットにより、検索結果をカテゴリ分けし、ユーザーはこれに基づいてさらに検索することができます。例えば、ユーザーが「傘」を検索した場合に、ファセットによって結果を価格別に、0 ~ 10 USD、10 ~ 20 USD、20 ~ 40 USD、のようにカテゴリ分けできます。Amazon CloudSearch では、結果のヒット数をファセットに含めることができます。これにより、各カテゴリに含まれるドキュメントの数が分かります。例えば、0 ~ 10 USD (4 件)、10 ~ 20 USD (123 件)、20 ~ 40 USD (57 件)などです。
Q: Amazon CloudSearch がサポートする言語は?
Amazon CloudSearch は現在 34 の言語をサポートしています(アラビア語(ar)、アルメニア語(hy)、バスク語(eu)、ブルガリア語(bg)、カタルーニャ語(ca)、簡体字中国語(zh-Simp)、繁体字中国語(zh-Trad)、チェコ語(cs)、デンマーク語(da)、オランダ語(nl)、英語(en)、フィンランド語(fi)、フランス語(fr)、ガリシア語(gl)、ドイツ語(de)、ギリシャ語(el)、ヘブライ語(he)、ヒンズー語(hi)、ハンガリー語(hu)、インドネシア語(id)、アイルランド語(ga)、イタリア語(it)、日本語(ja)、韓国語(ko)、ラトビア語(la)、ノルウェー語(no)、ペルシャ語(fa)、ポルトガル語(pt)、ルーマニア語(ro)、ロシア語(ru)、スペイン語(es)、スウェーデン語(sv)、タイ語(th)、トルコ語(tr))。また、Amazon CloudSearch は混合言語を含むフィールドに対して「Multiple(mul)」オプションをサポートします。
Q: Amazon CloudSearch では地理空間検索はサポートされますか?
はい。Amazon CloudSearch には緯度と経度をサポートするネイティブの型(LatLon)があるため、地理空間ベースの検索および並べ替えを簡単に実装できます。詳細については、Amazon CloudSearch 開発者ガイドの「Searching and Ranking Results by Geographic Location」を参照してください。
Q: アップロードしたドキュメントはいつ検索可能になりますか?
検索ドメインにアップロードされたドキュメントは、通常、数秒から数分以内に検索可能になります。
Q: 検索ドメインに送信できる検索リクエスト数はいくつですか?
検索ドメインに送信できる検索リクエスト数自体に制限はありません。
Q: 検索リクエストのレイテンシーに影響する要素は何ですか?
検索結果は通常、数百ミリ秒以内に検索され、ほとんどの場合、数百ミリ秒よりもずっと短い時間で検索されます。レイテンシーは、リクエストと応答がアプリケーションと検索ドメインの間を往復する時間、検索リクエストの複雑度、検索ドメインの使用率といった多くの要素に影響されます。
Q: 検索リクエストを複雑にする要素は何ですか?
Amazon CloudSearch は、幅広い範囲の検索リクエストをすばやく効率的に処理するよう設計されています。どのドキュメントが一致するのか判断する式や、各ドキュメントの一致度を判断する追加条件によって、検索リクエストの複雑度が変わります。多数のドキュメントが一致する検索リクエストは、ごく少数のドキュメントが一致する場合と比べて処理に時間がかかります。複雑な式の計算を行う検索リクエストは、フィールドが 1 つしかないような単純な条件を使用したランク付けを行う場合に比べて処理に時間がかかります。検索リクエストによる複雑度の違いが分かりやすいよう、各リクエストが処理するのにかかった時間が応答の一部として返されます。
Q: どこで検索アプリケーションを実行すれば、検索ドメインとの通信時間を最短にすることができますか?
アプリケーションをホスティングする AWS リージョンが検索ドメインと同じであれば、通信時間が最短になります。
Q: 検索インスタンスとは何ですか?
検索インスタンスとは、ドキュメントのインデックスを作成し、検索リクエストに応答するクラウド内の単一の検索エンジンです。限定された容量の RAM および CPU リソースでデータのインデックス作成およびリクエストの処理を行います。
Q: 検索パーティションとは何ですか?
検索パーティションとは、単一の検索インスタンスに一致するデータの一部です。検索ドメインには 1 つ以上の検索パーティションがあり、ドキュメントのインデックス作成によって検索パーティション数が変わります。
Q: アプリケーションの要件に合わせて検索ドメインを縮小または拡張するにはどうすればいいですか?
検索ドメインは、データおよびトラフィックの 2 つの側面で縮小および拡張します。データ容量が増大すると、インデックス化されたデータを含めるため、より多くの検索インスタンスが必要となり、検索インスタンス間でインデックスがパーティション化されます。リクエストの容量またはリクエストの複雑度が高くなると、各検索パーティションを複製し、その検索パーティションに CPU を提供する必要があります。例えば、データが 3 つの検索パーティションを必要とする場合、検索ドメインには 3 つの検索インスタンスが作られます。トラフィックが単一の検索インスタンスの容量を超えて増大すると、各パーティションは複製されて CPU 容量が追加提供され、検索ドメインには 3 つの検索インスタンスが追加されます。トラフィックがさらに増加すると複製も追加され、各パーティションごとに最大で 5 つの複製が追加されます。
Q: 検索ドメインにアップロードできるデータの容量は?
必要なパーティション数はデータおよび構成によって異なります。検索構成が適用された場合に検索パーティションが 10 件となるデータセットが、アップロードできる最大データ容量です。検索パーティションの制限を超過する場合、ドメインは、ドキュメントを削除してドメインのインデックスを再作成するまでアップロードの受け入れを停止します。10 を超える数の検索パーティションが必要な場合はお問い合わせください。
Q: 検索ドメインの検索インスタンスの数と種類を選択する必要がありますか?
CloudSearch は完全に管理された検索サービスであり、自動的に検索ドメインを縮小および拡張し、検索インスタンスの数と種類を選択します。任意の検索ドメインに含まれるすべての検索インスタンスは同じ種類であり、この種類は、データまたはトラフィックが増大するのに応じて変化します。
また、Amazon CloudSearch ドメインのスケーリングオプションを設定して、次のようなこともできます。
- アップロードキャパシティの増加
- 検索リクエストのスピードアップ
- 検索キャパシティの増加
- 耐障害性の改善
Q: Amazon CloudSearch がサポートするインスタンスタイプは何ですか?
Amazon CloudSearch は次のインスタンスタイプをサポートします。
- スモールの検索インスタンス
- ラージの検索インスタンス
- エクストララージの検索インスタンス
- ダブルエクストララージ検索インスタンス
Q: 検索ドメインの検索インスタンスの数と種類を調べるにはどうすればよいですか?
AWS マネジメントコンソール、AWS SDK、または AWS CLI を使用して、検索ドメインにある検索インスタンスの数と種類を確認できます。検索インスタンスの数と種類はその時によって変化し、インデックス化可能なデータと検索トラフィックに応じて自動的に縮小および拡張します。
Q: 検索ドメインの縮小と拡張は、データとトラフィックの変化に合わせてどの程度迅速に行えますか?
検索ドメインは通常、トラフィックの増大には数分以内に対応します。データ量の変更またはトラフィックの減少にはこれよりも時間がかかりますが、IndexDocuments 操作を呼び出すことでこの処理を速めることができます。大量のデータをアップロードしようとしている、またはクエリのトラフィックが急増すると予測される場合は、目的のインスタンスタイプと複製カウントを設定することでドメインを事前にスケーリングできます。詳細については、Amazon CloudSearch 開発者ガイドの「Configuring Scaling Options」を参照してください。
Q: Amazon CloudSearch はマルチ AZ 配置をサポートしますか?
はい。Amazon CloudSearch はマルチ AZ 配置をサポートします。マルチ AZ オプションが有効な場合、Amazon CloudSearch は 2 番目のアベイラビリティーゾーンの検索ドメインに追加インスタンスをプロビジョニングして維持し、高可用性を確保します。更新は両方のアベイラビリティーゾーンのインスタンスに自動的に適用されます。検索トラフィックは全インスタンス間で分散され、障害発生時にはどちらのゾーンのインスタンスでも全負荷を処理できます。
Q: 新しいマルチ AZ 機能のしくみはどのようなものですか? システムは障害発生時にダウンタイムが発生しますか?
マルチ AZ オプションが有効な場合、障害発生時はどのゾーンの Amazon CloudSearch のインスタンスでも全負荷を処理できます。サービスの中断またはあるゾーンのインスタンスの質が低下した場合、Amazon CloudSearch はすべてのトラフィックを他のアベイラビリティーゾーンにルーティングします。冗長化インスタンスが別のアベイラビリティーゾーンにリストアされます。管理操作やサービスの中断は発生しません。
実行中クエリの中には、失敗して再試行が必要になるものもあります。検索ドメインに送信された更新は永続的に保存され、障害発生時に失われることはありません。
Q: 検索ドメインは 3 つ以上のアベイラビリティーゾーンにデプロイできますか?
1 つのドメインをデプロイできるアベイラビリティーゾーンの最大数は 2 つです。
Q: 検索ドメインのマルチ AZ 設定を変更できますか。
はい。検索ドメインのマルチ AZ 設定は有効、無効を切り替えることができます。この設定の変更中もサービスは中断しません。
Q: 検索ドメインをデプロイするアベイラビリティーゾーンを選択できますか?
現時点では、Amazon CloudSearch は同じリージョン内の代替アベイラビリティーゾーンを自動的に選択します。
Q: ドメインが使用するインスタンスタイプを選択できますか ?
はい。Amazon CloudSearch の最新のリリースでは、ドメインに目的のインスタンスタイプを指定できます。Amazon CloudSearch は必要に応じてより大型のインスタンスタイプにドメインを拡張しますが、小型のインスタンスタイプに縮小することはありません。
Q: データを CloudSearch に移行するのに最も早い方法は何ですか?
デフォルトでは、すべてのドメインの初期の検索インスタンスはスモールです。大量のデータをアップロードする必要がある場合は、事前にドメインを大型のインスタンスタイプに拡張する必要があります。詳細については、Amazon CloudSearch 開発者ガイドの「Bulk Uploads」を参照してください。
Q: 初回セットアップにどのインスタンスタイプを選ぶ必要があるのかはどうすればわかりますか?
1 GB 以下のデータのデータセットまたは 100 万個以下の 1KB のドキュメントについては、1 つのスモール検索インスタンスのデフォルト設定で開始してください。これよりも大きなデータセットについては、目的のインスタンスタイプを設定してドメインの事前ウォーミングを行うことを検討してください。最大 8 GB までのデータセットについては、ラージ検索インスタンスで開始してください。8 GB ~ 16 GB のデータセットについては、エクストララージ検索インスタンスで開始してください。16 GB ~ 32 GB のデータセットについては、ダブルエクストララージ検索インスタンスで開始してください。もっと多くのアップロード容量が必要であるか、500 GB 以上をインデックス化する場合は、お問い合わせください。
Q: 新しいバージョンの Amazon CloudSearch で使用できる追加のセキュリティ機能は何ですか?
最新リリースの Amazon CloudSearch では、構成サービスおよびすべての検索ドメインサービスに対応した IAM との統合が提供されます。特定の Amazon CloudSearch アクションへのアクセスをコントロールしたり、すべてのリクエストに対してリクエスト認証を求めたりできます。リクエストの認証には、署名バージョン 4 の署名を使用します。
Q: Amazon CloudSearch に安全にデータをアップロードする方法は?
Amazon CloudSearch への接続時に HTTP ではなく HTTPS を使用することにより、保護および暗号化された SSL 接続を使用してデータを送信することができます。
Q: データは既に暗号化されています。暗号化したデータと暗号キーを送信することはできますか?
ユーザーにより生成された暗号化キーはサポートしておりません。データを複合化して HTTPS を使用してアップロードする必要があります。
Q: 暗号化された検索結果はサポートしていますか?
はい。すべての Amazon CloudSearch リクエストで HTTPS をサポートします。
Q: 特定のユーザーが検索ドメインにアクセスするのを防ぐにはどうすればよいですか?
Amazon CloudSearch では、構成サービスおよびすべての検索ドメインサービスに対応した IAM との統合が提供されます。ユーザーに Amazon CloudSearch へのフルアクセス権を付与したり、特定のドメインへのアクセスを制限したり、特定のアクションへのアクセスを許可または拒否したりできます。
Q: Amazon CloudSearch の使用に対する課金と請求はどのように行われるのですか?
サービスの利用を開始するためのセットアップ料金や契約はありません。月末以後に、その月の利用に対してクレジットカードに自動的に課金されます。Amazon Web Services アカウントにログインし、[お客様のウェブ サービス アカウント] にある [アカウント アクティビティ] をクリックすることにより、AWS ウェブサイトでいつでも現在の請求期間の料金を表示することができます。
Q: Amazon CloudSearch を使用するのに必要な費用はいくらになりますか?
現在のところ、Amazon CloudSearch の料金体系に変更はありません。詳細な価格情報については、Amazon CloudSearch 料金表をご参照ください。
Q: Amazon CloudSearch には無料トライアル版はありますか?
はい、新規の CloudSearch のお客様は無料トライアル版をご利用いただけます。詳しくは、Amazon CloudSearch 30 日間無料トライアルを参照してください。
Q: 新しいバージョンの Amazon CloudSearch を利用するにはどのくらいの費用がかかりますか。
現在のところ、Amazon CloudSearch の料金体系に変更はありません。詳細については料金表ページを参照してください。
Q: 新しいバージョンの Amazon CloudSearch を使用すると、費用の削減につながりますか?
最新バージョンの Amazon CloudSearch は、高度なインデックス圧縮を特長としており、各インスタンスタイプで大型インデックスをサポートします。これにより、新しいバージョンの Amazon CloudSearch が旧バージョンよりも効率的になり、大幅な費用削減につながります。
Q: 料金は税込み価格ですか?
別途記載がない限り、表示される料金に VAT、売上税を含む税金等および関税は一切含まれません。 日本の居住者であるお客様が AWS サービスをご利用になった場合には、料金とあわせて別途消費税をご請求させていただきます。詳細はこちらをご覧ください。