Experimente o Amazon CloudSearch gratuitamente

Inicie um teste gratuito do CloudSearch
Saiba mais

Obtenha 750 horas gratuitas de instâncias de pesquisa totalmente funcionais por 30 dias. Para começar:

Faça login em sua conta da AWS e inicie o console do CloudSearch

Crie e configure um domínio de pesquisa com alguns cliques

Carregue os dados e envie solicitações de pesquisa pelo console, SDK da AWS ou CLI


P: O que é o Amazon CloudSearch?

O Amazon CloudSearch é um serviço totalmente gerenciado na nuvem AWS que torna mais fácil de configurar, gerenciar e dimensionar uma solução de pesquisa para o seu site ou aplicativo.

P: Quais são os benefícios de executar um serviço de pesquisa gerenciado como o Amazon CloudSearch em relação a executar meu próprio serviço de pesquisa no EC2?

 

O Amazon CloudSearch oferece diversas vantagens em relação à execução do seu próprio serviço autogerenciado de pesquisa, incluindo fácil configuração, escalabilidade automática para dados e tráfego, clusters com recuperação automática e alta disponibilidade com Multi-AZ. Com apenas alguns cliques no AWS Management Console, você pode criar um domínio de pesquisa e enviar os dados a serem pesquisados. O Amazon CloudSearch fornece os recursos necessários automaticamente e implementa um índice de pesquisa altamente preciso.

P: O que é um mecanismo de pesquisa?

Um mecanismo de pesquisa permite realizar pesquisas em grandes grupos de itens, essencialmente textuais (denominados "documentos"), para obter rapidamente os resultados que correspondam melhor à pesquisa. As solicitações de pesquisa são geralmente constituídas por poucas palavras de texto não estruturado, como "músicas caetano veloso". Os resultados obtidos são geralmente classificados com os itens de maior correspondência, ou mais relevantes, listados primeiro (os que estão mais relacionados com os termos de pesquisa).

Os documentos podem ser completamente não estruturados, ou conter campos múltiplos que podem opcionalmente ser pesquisados individualmente. Por exemplo, um serviço de pesquisa de filmes pode ter documentos com campos de título, diretor, ator, descrição e críticas. Os resultados obtidos por um mecanismo de pesquisa são geralmente proxies dos documentos subjacentes, como URLs que fazem referência a páginas da web específicas. No entanto, o serviço de pesquisa pode também obter o conteúdo real de campos individuais.

P: Quais são as vantagens oferecidas pelo Amazon CloudSearch?

O Amazon CloudSearch é um serviço de pesquisa totalmente gerenciado com escalabilidade automática conforme o volume de dados e a complexidade das solicitações de pesquisa, a fim de fornecer resultados rápidos e precisos. O Amazon CloudSearch permite que os clientes acrescentem funcionalidades de pesquisa sem a necessidade de gerenciar hosts, escalabilidade de dados e tráfego, redundância ou pacotes de software. Os usuários pagam tarifas por hora reduzidas, apenas pelos recursos utilizados. O Amazon CloudSearch pode oferecer um custo total de propriedade significativamente mais baixo em comparação ao custo de operação e gestão do seu próprio ambiente de pesquisa.

P: É possível usar o Amazon CloudSearch com um serviço de armazenamento?

Um serviço de pesquisa e um serviço de armazenamento são complementares. Um serviço de pesquisa requer que seus documentos já estejam armazenados em algum lugar, seja em arquivos em um sistema de arquivos, dados no Amazon S3 ou em registros contidos em uma instância do Amazon DynamoDB ou Amazon RDS. O serviço de pesquisa é um sistema de recuperação rápido que torna esses itens pesquisáveis, com latências de menos de um segundo, por meio de um processo denominado indexação.

P: É possível usar o Amazon CloudSearch com um banco de dados?

Os mecanismos de pesquisa e os bancos de dados não se excluem mutuamente. Pelo contrário, muitas vezes eles são usados em conjunto. Se você já tem um banco de dados que contém dados estruturados, pode ser aconselhável usar um mecanismo de pesquisa para filtrar e classificar de maneira inteligente o conteúdo do banco de dados, usando palavras-chave de pesquisa como critérios de relevância.

Um serviço de pesquisa pode ser usado para indexar e pesquisar dados estruturados ou não estruturados. O conteúdo pode ser proveniente de diversas fontes, além de incluir campos de banco de dados juntamente com arquivos de diferentes formatos, páginas da web, e assim por diante. Um serviço de pesquisa pode comportar uma classificação de resultados personalizável e/ou recursos de pesquisa especiais, como a utilização de facetas para filtragem não disponíveis nos bancos de dados.

P: Em que regiões o Amazon CloudSearch está disponível?

O Amazon CloudSearch está disponível nas seguintes regiões da AWS: Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon), Oeste dos EUA (Norte da Califórnia), UE (Irlanda), UE (Frankfurt), América do Sul (São Paulo) e Ásia-Pacífico (Cingapura, Tóquio, Sydney e Seul).


P: Quais recursos de pesquisa novos o Amazon CloudSearch oferece?

Na sua versão mais recente, o Amazon CloudSearch é compatível com vários novos recursos de pesquisa e administração. Os novos recursos chave incluem:

  • Suporte a idiomas:
    • 34 idiomas, mais a opção “múltiplo” para lidar com campos com mais de um idioma
    • Configuração de idioma por campo
    • Análise de texto especifica para idiomas
    • Algoritmos de raízes de palavras estão disponíveis em múltiplos níveis para vários idiomas, inclusive "nenhum"
  • Recursos de pesquisa aprimorados:
    • Sugestões
    • Destaque
    • Pesquisa geoespacial
    • Novos tipos de dados: Data, duplo, inteiro de 64 bits positivo ou negativo, latlon
    • Pesquisa por frases inexatas
    • Melhoria de termos
    • Pesquisas aprimoradas de intervalo em todos os tipos de campo
    • Suporte para vários analisadores de consulta: Simples, estruturado, lucene, dismax
    • Opções de configuração do analisador de consulta
  • Recursos de administração:
    • Opção de alta disponibilidade
    • Integração ao IAM
    • Escalabilidade configurável pelo usuário
  • Disponível em regiões adicionais da AWS: Ásia-Pacífico (Tóquio), Ásia-Pacífico (Cingapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Seul) e América do Sul (São Paulo)

P: O Amazon CloudSearch ainda suporta dicionários de raízes de palavras?

Sim. A nova versão do Amazon CloudSearch oferece suporte a dicionários de raízes de palavras, além dos algoritmos de raízes de palavras.

P: A nova versão do Amazon CloudSearch usa o Apache Solr?

Sim. A última versão do Amazon CloudSearch foi alterada para utilizar o Apache Solr como mecanismo de pesquisa de texto. Agora o Amazon CloudSearch oferece diversos recursos populares de mecanismo de pesquisa disponíveis no Apache Solr, além da experiência do serviço de pesquisa gerenciado que facilita a configuração, operação e a escalabilidade de domínios de pesquisa.

P: Posso acessar a nova versão do Amazon CloudSearch usando o console?

Sim. É possível acessar a nova versão do Amazon CloudSearch usando o console. Se você for um cliente Amazon CloudSearch com domínios de pesquisa existentes, você tem a opção de selecionar qual versão do Amazon CloudSearch você quer usar ao criar novos domínios de pesquisa. Os novos clientes usarão a nova versão do Amazon CloudSearch por padrão e não terão acesso à versão 2011-01-01.

P: Quais tipos de dados são suportados pela nova versão do Amazon CloudSearch?

O Amazon CloudSearch oferece suporte a dois tipos de campos de texto: Texto e literal. Os campos de texto são processados de acordo com o idioma configurado no campo para determinar as palavras que podem servir como correspondência para consultas. Os campos literais não são processados e devem corresponder exatamente, inclusive em maiúsculas e minúsculas. O CloudSearch também oferece suporte a quatro tipos numéricos: Inteiro, duplo, data e latlon. Os campos int contêm valores inteiros de 64-bit positivos ou negativos. Os campos duplos contêm valores de ponto flutuante de largura dupla. Os campos date contêm datas especificadas em UTC (Coordinated Universal Time) seguindo o padrão IETF RFC3339: aaaa-mm-ddT00:00:00Z. Os campos latlon contêm uma localização armazenada como um par de valores de latitude e longitude.

P: Os meus domínios de pesquisa atuais criados com a versão 2011-02-01 do Amazon CloudSearch continuarão a funcionar?

Sim. Os domínios de pesquisa existentes criados com a versão 2011-02-01 do Amazon CloudSearch continuarão a funcionar.

P: É possível utilizar os novos recursos nos meus domínios de pesquisa já criados com a versão de 2011-01-01 do Amazon CloudSearch?

Não. Os domínios atuais criados com a versão de 2011-01-01 do Amazon CloudSearch não têm acesso aos recursos disponíveis na nova versão. Para acessar os novos recursos é necessário criar um novo domínio de pesquisa na versão 2013-01-01 do Amazon CloudSearch.

P: Como posso migrar meus aplicativos criados com base na versão 2011-01-01 do Amazon CloudSearch para a nova versão do Amazon CloudSearch?

Para utilizar a nova versão do Amazon CloudSearch é necessário recriar os domínios atuais na nova versão do Amazon CloudSearch e reenviar os dados. Para obter mais informações, consulte Migrating to the 2013-01-01 API no Amazon CloudSearch Developer Guide.

 

 

P: A AWS continuará a oferecer suporte à versão 2011-02-01 do Amazon CloudSearch?

Sim. A AWS continuará a oferecer suporte à versão 2011-02-01 do Amazon CloudSearch.

 

P: Posso criar novos domínios de pesquisa com a versão 2011-02-01 do Amazon CloudSearch?

Os clientes atuais do Amazon CloudSearch com domínios de 2011-02-01 poderão escolher se os novos domínios usarão a API de 2011-02-01 ou a nova API 2013-01-01. Domínios de pesquisa criados por novos clientes serão criados automaticamente com o API 01/01/2013.

P: Posso aproveitar a oferta de teste gratuito da nova versão do Amazon CloudSearch?

Novos clientes ainda podem aproveitar a oferta de teste gratuito disponível com o Amazon CloudSearch. Para obter detalhes, consulte a página Teste gratuito do Amazon CloudSearch.


P: Como faço para começar a usar o Amazon CloudSearch?

Para se cadastrar no Amazon CloudSearch, clique no botão Criar conta gratuita na página de detalhes do Amazon CloudSearch e complete o processo de cadastramento. Você precisa ter uma conta da Amazon Web Services. Caso já não tenha uma, você será solicitado a criar uma conta da AWS ao começar o processo de cadastramento no Amazon CloudSearch.

Após efetuar seu cadastro, selecione Amazon CloudSearch no AWS Management Console. Com o console do Amazon CloudSearch é possível criar rapidamente um domínio de pesquisa, configurar os campos de pesquisa, enviar dados de amostra e consultas de pesquisa ao domínio de pesquisa. Você também pode usar os AWS SDKs e o CLI para executar essas operações.

Para obter mais informações, consulte o tutorial de Getting Started no Amazon CloudSearch Developer Guide.

P: Os AWS SDKs fornecem suporte para o Amazon CloudSearch?

Sim, os AWS SDKs para Java, Ruby, Python, .Net, PHP e Node.js fornecem suporte para o CloudSearch. Usando os AWS SDKs, é possível criar rapidamente um domínio de pesquisa, configurar os campos de pesquisa, fazer upload de dados e enviar consultas de pesquisa ao seu domínio de pesquisa.

P: O AWS CLI fornece suporte para o Amazon CloudSearch?

Sim, o AWS CLI fornece suporte para o CloudSearch. Usando o AWS CLI, é possível criar rapidamente um domínio de pesquisa, configurar os campos de pesquisa, fazer upload de dados e enviar consultas de pesquisa ao seu domínio de pesquisa.

P: Eu ainda posso usar os CLTs do Amazon CloudSearch?

Sim, os CLTs do Amazon CloudSearch continuarão a funcionar.


P: O que é um domínio de pesquisa e como faço para criar um?

Um domínio de pesquisa é um recipiente de dados e um conjunto de serviços que tornam os dados pesquisáveis. Esses serviços incluem:

  • Um serviço de documentos que permite fazer o upload de dados ao seu domínio para indexação.
  • Um serviço de pesquisa que permite efetuar solicitações de pesquisa entre os dados indexados.
  • Um serviço de configuração para controlar o comportamento de seu domínio (incluindo a classificação por relevância).

É possível criar, gerenciar e excluir domínios de pesquisa utilizando o AWS Management Console, os AWS SDKs ou o AWS CLI.

P: Como faço o upload de documentos para meu domínio de pesquisa?

Você faz o upload de documentos para o seu domínio usando o AWS Management Console, os AWS SDKs ou o AWS CLI.

P: Meus documentos precisam estar em um formato específico?

Para que seja possível realizar pesquisas em seus dados, o formato dos dados deve ser JSON ou XML.  Cada item que você deseja poder obter como resultado de pesquisa é representado como um documento. Cada documento tem um ID de documento exclusivo e um ou mais campos que contêm os dados que você deseja pesquisar e obter como resultado de pesquisas. O Amazon CloudSearch gera um índice de pesquisa com base nos dados do documento de acordo com os campos de indexação configurados para o domínio. À medida que os dados mudam, você envia atualizações para adicionar ou excluir documentos do índice.

P: Como posso criar lotes de documentos formatados para o Amazon CloudSearch?

Para criar lotes de documento que descrevem seus dados, crie arquivos de texto JSON ou XML que especifiquem:

  • O tipo de operação: Adicionar ou excluir
  • Um identificador exclusivo
  • Os campos e os respectivos dados

O exemplo a seguir mostra um lote de documento único formatado em JSON:

[
    {
       "fields" : {
         "directors" : [
             "Francis Lawrence"
          ],
          "release_date" : "2013-11-11T00:00:00Z",
          "genres" : [
             "Action",
             "Adventure",
             "Sci-Fi",
             "Thriller"
          ],
          "image_url" : "http://ia.media-imdb.com/images/M/MV5xMzzAx._V1_SX400_.jpg",
          "plot" : "Katniss Everdeen and Peeta Mellark become targets of the Capitol after their victory in the 74th Hunger Games sparks a rebellion in the Districts of Panem.",
          "title" : "The Hunger Games: Catching Fire",
          "rank" : 4,
          "running_time_secs" : 8760,
          "actors" : [
             "Jennifer Lawrence",
             "Josh Hutcherson",
             "Liam Hemsworth"
           ],
          "year": 2013
       },
       "id" : "tt1951264",
       "type": "add"
    }
]

 

Observe que os valores numéricos, como a versão e o ano, não estão entre aspas, e que os valores em um campo de valores múltiplos, como gênero, são listados como uma matriz JSON.

Para tornar esses dados disponíveis para o Amazon CloudSearch, você pode salvá-los em um arquivo e fazer o upload desse arquivo usando o AWS Management Console, os AWS SDKs ou o AWS CLI.

P: Como são indexados os documentos?

Os documentos são indexados automaticamente quando você os envia ao seu domínio de pesquisa. Você pode também reindexar explicitamente seus documentos ao fazer alterações das configurações, enviando uma solicitação de IndexDocuments.

P: Quando devo reindexar meu domínio?

Certas opções de configuração, como a adição de um novo campo de indexação ou a atualização de dicionários de raízes de palavras e de palavras vazias, não estarão disponíveis enquanto o seu domínio não for reindexado. Após fazer alterações que requerem indexação, o status do domínio indicará que ele precisa ser indexado. Você pode iniciar a indexação a partir do AWS Management Console, dos AWS SDKs ou do AWS CLI.

P: Como faço para enviar solicitações de pesquisa ao meu domínio de pesquisa?

Todo domínio de pesquisa tem um serviço de pesquisa com base em REST com um URL exclusivo (ponto de extremidade de pesquisa) que aceita solicitações de pesquisa em seu conjunto de documentos. Você pode enviar solicitações de pesquisa a partir do AWS Management Console, dos AWS SDKs ou do AWS CLI.

P: Um domínio de pesquisa pode cobrir várias zonas de disponibilidade?

Sim. Se você ativar a opção Multi-AZ, o Amazon CloudSearch implementa instâncias adicionais em uma segunda zona de disponibilidade na mesma região. Para obter mais informações, consulte Configuração de opções de disponibilidade no Guia do desenvolvedor do Amazon CloudSearch.

P: Posso mover um domínio de pesquisa de uma região para outra?

No momento, não há como migrar automaticamente um domínio de pesquisa de uma região para outra. Você precisará criar um novo domínio na região-alvo, configurar o domínio, fazer upload dos seus dados e excluir o domínio original.

P: Como faço a exclusão de meu domínio de pesquisa?

Para excluir um domínio de pesquisa, clique no botão Delete Domain no console do Amazon CloudSearch. Também é possível excluir domínios por meio dos AWS SDKs ou do AWS CLI.

P: Como faço a exclusão de documentos do meu domínio de pesquisa?

Para excluir documentos é preciso especificar uma operação de exclusão no lote sendo enviado que contenha o ID do documento que você deseja remover.

Você pode enviar atualizações de dados por meio do AWS Management Console, dos AWS SDKs ou do AWS CLI.

P: Como faço para esvaziar meu domínio de pesquisa?

Se você quiser manter os endpoints de seu domínio, poderá enviar uma exclusão para cada documento que esteja em seu domínio.

P: Por que o meu domínio está no estado "Processing"?

Um domínio pode estar em um destes três estados diferentes: "processing", "active" ou "reindexing". Normalmente, o domínio está no estado "active", o que indica que nenhuma mudança está sendo feita no momento, que o domínio pode ser consultado e atualizado e que todas as alterações anteriores estão visíveis nos resultados de pesquisa.

Quando é necessário reindexar um domínio, o Amazon CloudSearch precisa recriar o índice completamente. No entanto, o domínio não entra no estado "processing" até que você inicie a reindexação. Nessa fase, ainda é possível consultar e atualizar o domínio, mas as mudanças de configuração não serão visíveis nos resultados de pesquisa até que a indexação seja concluída e o status do domínio volte a ser "active".

Você também pode continuar a fazer upload de lotes de documentos para o domínio. No entanto, se você enviar um grande volume de atualizações enquanto o domínio está no estado "processando", o tempo necessário para aplicar as atualizações no índice de pesquisa poderá ser maior. Se isso se tornar um problema, reduza a taxa de atualização até que o domínio volte para o estado "active".


P: Quais são as melhores práticas para a inicialização de dados no CloudSearch?

Após lançar o domínio, a próxima etapa é carregar os dados no Amazon CloudSearch. Normalmente, isso é feito com o upload de um único conjunto de dados grande, seguido de atualizações ou adições menores à medida que novos dados são acrescentados. As diretrizes a seguir ajudarão a agilizar e a facilitar a inicialização dos dados iniciais no CloudSearch.

1. Use a ferramenta de linha de comando curl-v ao preparar o script

Durante o upload de um conjunto de dados, o script criado lê os dados e os usa para criar documentos JSON ou XML. Recomendamos preparar esse script antecipadamente e usar curl ou outra ferramenta de linha de comando simples para verificar se você consegue fazer o upload dos documentos criados pelo script. Muitas vezes, a opção "-v" no curl oferece informações mais detalhadas sobre problemas de sintaxe que o AWS SDK ou o Boto, que suprimem os erros para fins de produção. O curl exibe mensagens de erro mais detalhadas, que ajudam a identificar as origens dos problemas.

2. Use o código de caracteres UTF-8

Verifique se todos os dados estão formatados com o código de caractere UTF-8 e se todos os caracteres Unicode inválidos foram removidos antes do upload para o CloudSearch. Caracteres inválidos causam falha no upload do documento.

3. Agrupe seus documentos em lotes

O agrupamento de documentos em lotes é talvez a etapa mais importante da inicialização de dados. Além de ineficiente, o envio de documentos individuais ao CloudSearch também causa erros evitáveis.

Um lote de documentos é simplesmente uma coleção de operações de adição e exclusão que representam os documentos que você deseja adicionar, atualizar ou excluir no domínio. Os lotes são descritos em JSON ou XML. Quando você faz upload dos lotes para um domínio, os dados são indexados automaticamente de acordo com as opções de indexação do domínio. Como você é cobrado pelo número total de uploads de lotes de documentos para o domínio de pesquisa, é mais econômico fazer o upload dos dados em lotes de 5 MB, o tamanho máximo permitido para cada upload. Além disso, você pode fazer o upload de batches em paralelo para reduzir o tempo necessário para fazer o upload dos dados.

4. Ajuste prévio da escala

Também é importante ajustar previamente a escala dos dados antes do upload para o CloudSearch. Esse ajuste prévio envolve a seleção do tipo de instância adequado para a quantidade de dados do upload.

A escolha de uma instância com capacidade suficiente para processar o tamanho do upload pode ajudar a evitar erros e uma grande quantidade de replicações. Embora a replicação possa ajudar a diminuir o tempo de resposta das pesquisas, não aumenta o tamanho do pipe de dados nem resolve os principais problemas dos uploads de dados.

O CloudSearch aumentará automaticamente a escala para instâncias maiores à medida que você envia mais dados. No entanto, a seleção prévia do tipo de instância adequado reduz o tempo posteriormente no processo de inicialização, pois o aumento de escala de uma instância para outra normalmente é um processo mais lento. Veja a seguir um exemplo de script para ajuste prévio de escala do domínio na inicialização e para restauração do tipo de instância após a carga dos dados.

Ajuste prévio de escala antes da inicialização:

aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m3.2xlarge

 

aws cloudsearch index-documents --domain-name foo

Restauração após a carga de dados:

aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m1.small

 

aws cloudsearch index-documents --domain-name foo

P: Quais são algumas maneiras de evitar erros 504?

Caso ocorram erros 504 ou grande quantidade de replicações, tente mudar para um tipo de instância maior. Por exemplo, se você tiver problemas com uma instância do tipo m3.large, mude para m3.xlarge. Se os erros 504 persistirem após o ajuste prévio de escala, comece a agrupar os dados em lotes e aumente o intervalo entre novas tentativas.

P: Quais são as melhores práticas para acelerar a configuração e a reindexação de domínios?

Quando altera as opções de configuração do domínio de pesquisa, você deve recriar o índice de pesquisa para que as alterações façam efeito nos resultados de pesquisa. A recriação do índice pode levar de 30 a 60 minutos, tanto para configurações individuais quanto para várias configurações por vez. Mesmo que seu domínio tenha apenas um pequeno número de documentos, a indexação tem essa duração devido ao processamento e ao provisionamento necessários para criar e distribuir o índice. Portanto, planeje as alterações de configuração antecipadamente, faça todas as alterações de uma só vez e reindexe o domínio. Isso também se aplica à configuração de um novo domínio. Planeja a configuração antes de definir o domínio para executar apenas uma indexação e disponibilizar o domínio no menor tempo possível.

Algumas alterações de domínio exigem reindexação, enquanto que outras precisam apenas da reimplantação do índice atual. A reimplantação do domínio demora de 10 a 15 minutos, enquanto que a reindexação leva de 30 a 60 minutos. Durante a reimplantação, o CloudSearch cria novos nós, implanta o índice neles e desativa os nós anteriores. O status do domínio muda para "Processing" durante a reimplantação. Quando a reindexação é necessária, o status do domínio muda para "Needs Indexing", seguido por "Processing" no início da indexação. Após a criação do novo índice, o domínio é reimplantado. A tabela a seguir resume quais alterações precisam de reindexação seguida de reimplantação, e quais alterações precisam somente de reimplantação. A compreensão dessas informações ajudará a planejar melhor as alterações de configuração.

Alteração                                         
Reindexação necessária
Reimplantação necessária
Multi-AZ Não
Sim

Campos do índice

Sim
Sim

Opções de campo do índice

Sim Sim

Tipo de instância

Sim Sim

Número de partições

Sim Sim

Número de replicações

Não Sim

Sugestores

Sim Sim

Expressões

Não Sim

Esquemas de análise

Sim Sim

P: Que recursos de pesquisa o Amazon CloudSearch oferece?

O Amazon CloudSearch oferece recursos para indexar e pesquisar dados estruturados e texto simples, incluindo pesquisa facetada, pesquisa de texto livre, expressões de pesquisa booleanas, classificação de relevância personalizável, expressões de classificação de tempo de consulta, ponderação de campos, pesquisa e classificação de resultados utilizando qualquer campo, e opções de processamento de texto, incluindo tokenização, palavras vazias, raízes de palavras e sinônimos. Ele oferece também a indexação de atualizações de documentos quase em tempo real. Os novos recursos incluem:

  • Sugestões de autopreenchimento
  • Destaque
  • Pesquisa geoespacial
  • Novos tipos de dados: Data, duplo, inteiro de 64 bits positivo ou negativo, latlon
  • Campos dinâmicos
  • Estatísticas de campos de índice
  • Pesquisa por frases inexatas
  • Melhoria de termos
  • Pesquisas aprimoradas de intervalo em todos os tipos de campo
  • Filtros de pesquisa que não afetam a relevância
  • Suporte para vários analisadores de consulta: Simples, estruturado, lucene, dismax
  • Opções de configuração do analisador de consulta

P: O que é facetamento?

O facetamento permite categorizar os resultados das pesquisas através de refinamentos após os quais o usuário pode efetuar pesquisas adicionais. Por exemplo, o usuário faz uma pesquisa com o termo "guarda-chuvas", e as facetas lhe permitem agrupar os resultados por preço, como 0 USD até 10 USD, 10 USD até 20 USD, 20 USD até 40 USD, e assim por diante. O Amazon CloudSearch permite também incluir contagens de resultados nas facetas, de modo que cada refinamento tenha a contagem do número de documentos contidos no respectivo grupo. Um exemplo poderia ser: 0 USD até 10 USD (4 itens), 10 USD até 20 USD (123 itens), 20 USD até 40 USD (57 itens), e assim por diante.

P: Quais idiomas o Amazon CloudSearch suporta?

O Amazon CloudSearch atualmente oferece suporte a 34 idiomas: Árabe (ar), armênio (hy), basco (eu), búlgaro (bg), catalão (ca), chinês simplificado (zh-Simp), chinês tradicional (zh-Trad), tcheco (cs), dinamarquês (da), holandês (nl), inglês (en), finlandês (fi), francês (fr), galego (gl), alemão (de), grego (el), hebraico (he), hindi (hi), húngaro (hu), indonésio (id), irlandês (ga), italiano (it), japonês (ja), coreano (ko), letão (la), norueguês (no), persa (fa), português (pt), romeno (ro), russo (ru), espanhol (es), sueco (sv), tailandês (th) e turco (tr). Além disso, o Amazon CloudSearch suporta uma opção Múltiplo (mul) para campos que contém mais de um idioma.

P: O Amazon CloudSearch oferece suporte à pesquisa geoespacial?

Sim, o Amazon CloudSearch tem um tipo nativo para latitude e longitude (latlon), tornando fácil implementar pesquisas e classificação geográficas. Para obter mais informações, consulte Pesquisa e classificação de resultados por localização geográfica no Guia do desenvolvedor do Amazon CloudSearch.


P: Com que rapidez os documentos que enviei se tornarão pesquisáveis?

Geralmente, os documentos enviados a um domínio de pesquisa se tornam pesquisáveis após um período que pode variar entre alguns segundos e poucos minutos.

P: Quantas solicitações de pesquisa posso enviar ao meu domínio de pesquisa?

Não existe um limite intrínseco para o número de solicitações de pesquisa que podem ser enviadas a um domínio de pesquisa.

P: Quais fatores afetam a latência de minhas solicitações de pesquisa?

As solicitações de pesquisa são geralmente processadas em algumas centenas de milissegundos, e frequentemente muito mais rápido. A latência depende de muitos fatores, incluindo o tempo necessário para que as solicitações e as respectivas respostas se desloquem entre o aplicativo e o domínio de pesquisa, a complexidade da solicitação de pesquisa e com que intensidade você está usando o seu domínio de pesquisa.

P: O que torna uma solicitação de pesquisa mais complexa do que outra?

O Amazon CloudSearch foi criado para processar com eficiência uma ampla variedade de solicitações de pesquisa muito rapidamente. As solicitações de pesquisa variam em termos de complexidade conforme as expressões que determinam quais documentos correspondem à pesquisa e critérios adicionais que determinam o quanto cada documento corresponde à pesquisa. As solicitações de pesquisa que produzem um grande número de documentos correspondentes levam mais tempo para serem processadas do que as que produzem um número reduzido de documentos correspondentes. As solicitações de pesquisa que calculam expressões complexas levam mais tempo para serem processadas do que as que efetuam a classificação usando um critério simples, como um único campo. Para ajudar a entender melhor a diferença de complexidade entre solicitações de pesquisa, o tempo levado para processar a solicitação é exibido como parte do resultado.

P: Onde devo executar meu aplicativo de pesquisa para minimizar o tempo de comunicação com meu domínio de pesquisa?

Os aplicativos hospedados na mesma região da AWS em que está o seu domínio de pesquisa experimentarão os tempos de comunicação mais rápidos.


P: O que é uma instância de pesquisa?

Uma instância de pesquisa é um mecanismo de pesquisa único na nuvem que indexa documentos e responde a solicitações de pesquisa. Ele possui uma quantidade finita de recursos de RAM e de CPU para indexar dados e processar solicitações.

P: O que é uma partição de pesquisa?

Uma partição de pesquisa é a parte dos dados que encaixa em uma determinada instância de pesquisa. Um domínio de pesquisa pode ter uma ou mais partições de pesquisa, e o número de partições de pesquisa pode variar à medida que seus documentos são indexados.

P: Como ocorre a escalabilidade do meu domínio de pesquisa para atender às necessidades relacionadas com meu aplicativo?

Os domínios de pesquisa são escalados em duas dimensões: Dados e tráfego. À medida que o volume de dados aumenta, são necessárias instâncias de pesquisa mais numerosas (ou maiores) para conter os dados indexados, e o índice é dividido em partições correspondentes às instâncias de pesquisa. À medida que o volume ou a complexidade das solicitações aumentam, cada partição de pesquisa deve ser replicada para providenciar CPU adicional para a partição de pesquisa em questão. Por exemplo, se os dados requerem três partições de pesquisa, haverá três instâncias de pesquisa no domínio de pesquisa. À medida que o tráfego aumenta para além da capacidade de uma única instância de pesquisa, cada partição é replicada para providenciar capacidade de CPU adicional, acrescentando três instâncias de pesquisa ao domínio de pesquisa. Aumentos adicionais no tráfego resultarão em réplicas adicionais, até um máximo de cinco, para cada partição.

P: Quantos dados posso enviar ao meu domínio de pesquisa?

O número de partições de que você precisa depende dos dados e da configuração, portanto a máxima quantidade de dados que você pode enviar é o conjunto de dados que produz 10 partições de pesquisa quando a sua configuração de pesquisa é aplicada. Quando o limite para o número de partições de pesquisa é ultrapassado, seu domínio não aceitará mais uploads até que você exclua documentos e reindexe seu domínio. Se você precisa de mais de 10 partições de pesquisa, entre em contato conosco.

P: Preciso selecionar o número e o tipo de instâncias de pesquisa para o meu domínio de pesquisa?

O CloudSearch é um serviço de pesquisa totalmente gerenciado que escala o domínio de pesquisa e seleciona o número e o tipo de instâncias de pesquisa automaticamente. Todas as instâncias de pesquisa de um determinado domínio de pesquisa são do mesmo tipo, e esse tipo pode mudar com o tempo, à medida que os dados e/ou o tráfego aumentam.

Também é possível configurar opções de escalabilidade para um domínio Amazon CloudSearch para:

  • Aumentar a capacidade de upload
  • Acelerar as solicitações de pesquisa
  • Aumentar a capacidade de pesquisa
  • Melhorar a tolerância de falhas

P: Quais tipos de instância do são compatíveis com o Amazon CloudSearch?

O Amazon CloudSearch é compatível com os tipos de instância a seguir:

  • Instância de pesquisa pequena
  • Instância de pesquisa grande
  • Instância de pesquisa extragrande
  • Instância de pesquisa dupla extragrande

P: Como faço para saber o número e o tipo das instâncias de pesquisa contidas no meu domínio de pesquisa?

É possível descobrir o número e o tipo de instâncias de pesquisa em seu domínio de pesquisa usando o AWS Management Console, os AWS SDKs ou o AWS CLI. O número e o tipo de instâncias de pesquisa variam com o tempo, sendo aumentado ou diminuído de acordo com os dados indexáveis e o tráfego de pesquisa.

P: Com que rapidez meu domínio de pesquisa é escalado para se adaptar às alterações de dados e tráfego?

Os domínios de pesquisa geralmente reagem aos aumentos de variação do tráfego em poucos minutos. As variações no volume de dados ou a redução do tráfego podem levar mais tempo, mas é possível acelerar esse processo invocando uma operação de IndexDocuments. Se você estiver prestes a fazer upload de uma grande quantidade de dados ou se espera um aumento repentino no tráfego de consultas, é possível pré-escalar seu domínio ao configurar o tipo de instância e a contagem de replicação desejados. Para obter mais informações, consulte Configuração de opções de escalabilidade no Guia do desenvolvedor do Amazon CloudSearch.

P: O Amazon CloudSearch tem suporte para Implantações Multi-AZ?

Sim. O Amazon CloudSearch tem suporte para Implantações Multi-AZ. Quando a opção Multi-AZ está ativada, o Amazon CloudSearch oferece e mantém instâncias adicionais para seu domínio de pesquisa em uma segunda Zona de disponibilidade para garantir a alta disponibilidade. As atualizações são aplicadas automaticamente nas instâncias em ambas as Zonas de disponibilidade. O tráfego de pesquisa é distribuído por todas as instâncias e as instâncias em ambas as zonas são capazes de lidar com a carga completa no caso de uma falha.

P: Como o novo recurso de Multi-AZ funciona? O meu sistema sairá do ar em caso de falha?

Quando a opção Multi-AZ está ativada, as instâncias do Amazon CloudSearch em ambas as zonas são capazes de lidar com a carga completa no caso de uma falha. Se houver uma interrupção de serviço ou se as instâncias em uma zona forem degradadas, o Amazon CloudSearch roteia todo o tráfego para a outra zona de disponibilidade. Instâncias redundantes são restauradas em uma zona de disponibilidade separada sem qualquer intervenção administrativa ou interrupção de serviço.

Algumas consultas durante esse momento podem falhar e precisar serem feitas novamente. As atualizações enviadas para o domínio de pesquisa são armazenadas de forma durável e não são perdidas em caso de falha.

P: Um domínio de pesquisa pode ser implementado em mais de duas zonas de disponibilidade?

Não. O número máximo de zonas de disponibilidade nas quais um domínio pode ser implementado é dois.

P: Posso modificar a configuração Multi-AZ no meu domínio de pesquisa?

Sim. Você pode ligar e desligar a configuração Multi-AZ nos seus domínios de pesquisa. O serviço não é interrompido quando esta configuração é alterada.

P: Posso escolher em qual zona de disponibilidade meu domínio de pesquisa é implementado?

Não. No momento o Amazon CloudSearch escolhe automaticamente uma zona de disponibilidade alternativa na mesma região.

P: Posso escolher qual tipo de instância meu domínio usa?

Sim. Na versão mais recente, o Amazon CloudSearch permite que você especifique o tipo de instância desejado para seu domínio. Se necessário, o Amazon CloudSearch vai escalar seu domínio para um tipo de instância maior, mas ele nunca vai escalar para um tipo de instância menor.

P: Qual é a forma mais rápida de colocar meus dados no CloudSearch?

Por padrão, todos os domínios começam em uma instância de pesquisa pequena. Se você precisar fazer o upload de uma quantidade grande de dados, é preciso pré-escalar seu domínio para um tipo de instância maior. Para obter mais informações, consulte Bulk Uploads no Amazon CloudSearch Developer Guide.

P: Como posso saber qual tipo de instância devo escolher para minha configuração inicial?

Para conjuntos de dados com menos de 1 GB ou menos de um milhão de documentos de 1 KB, comece com as configurações padrão de uma única instância de pesquisa pequena. Para conjuntos de dados maiores, considere preparar o domínio adequadamente configurando o tipo de instância apropriado. Para conjuntos de dados de até 8 GB, comece com uma instância de pesquisa grande. Para conjuntos de dados entre 8 GB e 16 GB, comece com uma instância de pesquisa extragrande. Para conjuntos de dados entre 16 GB e 32 GB, comece com uma instância de pesquisa dupla extragrande. Entre em contato conosco se precisar de mais capacidade de upload ou se tiver mais de 500 GB para indexar.


P: Que recursos adicionais de segurança estão disponíveis na nova versão do Amazon CloudSearch?

Com a versão mais recente, o Amazon CloudSearch oferece integração ao IAM para o serviço de configuração e para todos os serviços do domínio de pesquisa. Você pode controlar o acesso a ações específicas do Amazon CloudSearch e exigir autenticação para todas as solicitações. As solicitações são autenticadas usando assinaturas do Signature versão 4.

P: Como faço o upload de dados para o Amazon CloudSearch com segurança?

Os dados que você envia são transferidos através de uma conexão SSL protegida e criptografada, usando HTTPS em vez de HTTP, quando você se conecta ao Amazon CloudSearch.

P: Meus dados já estão criptografados. Posso simplesmente enviar os dados criptografados e a chave de criptografia?

Nós não trabalhamos com chaves de criptografia geradas pelo usuário. Você precisará descriptografar os dados e enviá-los usando HTTPS.

P: É possível obter resultados de pesquisa criptografados?

Sim. É possível usar HTTPS para todas as solicitações ao Amazon CloudSearch.

P: Como faço para impedir que determinados usuários acessem meu domínio de pesquisa?

O Amazon CloudSearch oferece suporte à integração ao IAM para o serviço de configuração e para todos os serviços do domínio de pesquisa. Você pode conceder aos usuários acesso total ao Amazon CloudSearch, restringir o acesso a domínios específicos e permitir ou negar o acesso a ações configuração específicas.


P: Como será a cobrança e o faturamento do uso que eu fizer do Amazon CloudSearch?

Não há taxas de instalação ou gastos para começar a usar o serviço. Ao término do mês, haverá uma cobrança automática em seu cartão de crédito pela utilização do mês. Você pode visualizar suas despesas relativas ao período de cobrança a qualquer momento no site da AWS. Para isso, faça login em sua conta da Amazon Web Services e, em seguida, clique em Atividade da conta em Sua conta de serviços da web.

P: Quanto custa usar o Amazon CloudSearch?

Não tivemos mudanças na estrutura de definição de preço para o Amazon CloudSearch no momento. Para obter informações detalhadas sobre preços, consulte Definição de preço do Amazon CloudSearch.

P: Há uma versão de avaliação disponível para o Amazon CloudSearch?

Sim, há uma versão de avaliação disponível para novos clientes do CloudSearch. Para obter mais informações, consulte a Oferta do teste gratuito de 30 dias do Amazon CloudSearch.

P: Quando custa a nova versão do Amazon CloudSearch?

Não tivemos mudanças na estrutura de definição de preço para o Amazon CloudSearch no momento. Consulte a página de Definição de preço para mais informações.

 

P: Quais são as economias ao usar a nova versão do Amazon CloudSearch?

A última versão do Amazon CloudSearch oferece suporte à compressão avançada de índices e tamanhos de índices maiores em cada tipo de instância. Isto torna a nova versão do Amazon CloudSearch mais eficiente do que a versão anterior, e pode resultar em economias significantes.

P: Os preços incluem impostos?

Salvo indicação em contrário, nossos preços excluem impostos e taxas aplicáveis, incluindo o IVA e o imposto de vendas aplicável. Para clientes com endereço de pagamento no Japão, o uso da AWS está sujeito ao imposto sobre consumo japonês. Saiba mais.