Perguntas frequentes sobre o AWS Clean Rooms

Geral

O AWS Clean Rooms é um novo serviço que torna mais fácil para você e seus parceiros analisar e colaborar em conjuntos de dados coletivos para obter novos insights sem revelar os dados subjacentes uns para os outros. É possível criar suas próprias salas limpas em minutos e começar a analisar conjuntos de dados coletivos em apenas algumas etapas. Com o AWS Clean Rooms, é possível colaborar facilmente com centenas de milhares de empresas que já usam a AWS sem precisar migrar dados para fora do ambiente da AWS ou carregá-los em outra plataforma.

No Console de Gerenciamento da AWS, você pode escolher o tipo de análise que deseja realizar, os parceiros com os quais deseja colaborar e com quais conjuntos de dados gostaria de contribuir para uma colaboração. O AWS Clean Rooms permite realizar dois tipos de análises: consultas SQL e machine learning.

Quando você executa consultas SQL, o AWS Clean Rooms lê os dados onde eles residem e aplica regras de análise integradas e flexíveis para ajudar você a manter o controle sobre seus dados. O AWS Clean Rooms fornece um amplo conjunto de controles SQL de aprimoramento da privacidade, incluindo controles de consultas, restrições de saída de consultas e log de consultas, os quais permitem personalizar restrições nas consultas executadas por cada participante da sala limpa. Você pode usar o AWS Clean Rooms Differential Privacy selecionando uma regra de análise personalizada e, em seguida, configurando seus parâmetros diferenciais de privacidade. A privacidade diferencial ajuda você a proteger a privacidade de seus usuários com controles intuitivos e com respaldo matemático em apenas alguns cliques. Além disso, a Computação Criptográfica para Clean Rooms (C3R) ajuda você a manter dados confidenciais criptografados durante as análises de SQL.

O AWS Clean Rooms ML permite que você e um parceiro apliquem machine learning (ML) que reforça a privacidade a fim de gerar insights preditivos sem exigir o compartilhamento mútuo de dados brutos. Com a modelagem semelhante ao AWS Clean Rooms ML, você pode treinar seu próprio modelo personalizado usando seus dados e convidar seus parceiros a trazer uma pequena amostra de seus registros para uma colaboração para gerar um conjunto expandido de registros semelhantes e, ao mesmo tempo, proteger os dados subjacentes que pertencem a você e seu parceiro. A modelagem de assistência médica estará disponível nos próximos meses.

O AWS Clean Rooms ML foi criado e testado em uma ampla variedade de conjuntos de dados, como comércio eletrônico e streaming de vídeo, e pode ajudar os clientes a melhorar a precisão da modelagem semelhante em até 36%, em comparação com referências representativas do setor. Em aplicações do mundo real, como a prospecção de novos clientes, essa melhoria na precisão pode se traduzir em uma economia de milhões de dólares.

As colaborações do AWS Clean Rooms são limites lógicos seguros que permitem que os membros da colaboração executem consultas SQL e realizem modelagem de ML sem precisar compartilhar dados brutos com seus parceiros. Apenas empresas convidadas para a colaboração podem participar. Vários participantes podem contribuir com dados para uma colaboração, e um membro pode receber os resultados. Somente empresas que foram convidadas podem participar de uma colaboração no AWS Clean Rooms.

Usando o Console de Gerenciamento da AWS ou as operações da API, você criará uma colaboração em uma sala limpa, convidará as empresas com as quais deseja colaborar e selecionará as habilidades que cada participante terá na colaboração. Os participantes podem então configurar regras de como os dados estruturados podem ser consultados e treinar modelos de ML em seus dados. Os conjuntos de dados não são copiados das contas dos participantes e só são acessados quando necessário. Com o AWS Clean Rooms, você pode escolher o tipo de análise que deseja realizar: consultas SQL e modelagem de ML usando o AWS Clean Rooms ML. Ao usar consultas SQL, você também utiliza recursos adicionais, como criador de análises sem código, AWS Clean Rooms Differential Privacy e computação criptográfica. Após os participantes da colaboração associarem dados ou modelos a uma colaboração e as análises serem executadas, as saídas da colaboração serão armazenadas em um bucket designado do Amazon Simple Storage Service (Amazon S3).

O AWS Clean Rooms aceita até cinco participantes por colaboração.

Você controla quem pode participar da colaboração no AWS Clean Rooms e pode criar uma colaboração ou participar de um convite para colaborar. A participação é transparente para cada membro de uma colaboração e novas contas não podem ser adicionadas após a criação da colaboração. Porém, você pode configurar novas colaborações com diferentes clientes ou parceiros, se necessário. Você estabelece e gerencia o acesso ao seu conteúdo e também o acesso a serviços e recursos da AWS por meio de usuários, grupos, permissões e credenciais sob o seu controle.

Os clientes podem gerar insights usando SQL ou modelagem do AWS Clean Rooms ML em seus conjuntos de dados coletivos com seus parceiros, sem compartilhar ou revelar os dados subjacentes.

Usando SQL, vários colaboradores podem contribuir com dados, mas apenas um deles pode executar consultas SQL e receber os resultados. Ao ingressar em uma colaboração, os colaboradores concordam sobre qual parte executará as consultas, qual parte receberá os resultados e qual parte será responsável pelas cobranças pelos recursos de computação. Somente os convidados para essa colaboração podem obter insights com base nas regras de análise que você estabeleceu. Ao configurar uma colaboração com o AWS Clean Rooms, é possível especificar habilidades diferentes para cada membro da colaboração de acordo com seus casos de uso específicos. Por exemplo, se você quiser que a saída da consulta vá para um membro diferente, poderá designar um membro como o executor da consulta que pode escrever consultas e outro membro como o receptor do resultado da consulta que pode receber os resultados. Isso dá ao criador da colaboração a capacidade de garantir que o membro que pode fazer consultas não tenha acesso aos resultados das consultas.

Com o AWS Clean Rooms ML, um colaborador traz o conjunto de registros amostrados com base em se deseja encontrar segmentos semelhantes do parceiro; a outra parte tem a maior população a partir da qual geramos segmentos semelhantes com base em sua semelhança com os registros amostrados. O AWS Clean Rooms ML enviará os segmentos semelhantes de saída para um destino especificado pela parte responsável por trazer a maior população da qual derivamos os segmentos semelhantes.

O AWS Entity Resolution é integrado de forma nativa ao AWS Clean Rooms. Você pode usar a correspondência baseada em regras ou em provedores de serviços de dados para preparar, combinar e vincular seus dados de usuário aos dados do seu parceiro usando qualquer chave comum que escolher usar (como identificadores sob pseudônimo), dentro de uma colaboração com o AWS Clean Rooms com privacidade reforçada.

O AWS Clean Rooms está disponível nas regiões Leste dos EUA (Ohio), Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon), Ásia-Pacífico (Seul), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Tóquio), Europa (Frankfurt), Europa (Irlanda), Europa (Londres) e Europa (Estocolmo).

Com o AWS Clean Rooms, você pode usar regras de análise de SQL flexíveis e ML de aprimoramento da privacidade para atender às suas necessidades comerciais. Ao usar a análise de SQL, é possível escolher com flexibilidade qual colaborador paga pela capacidade computacional das consultas SQL executadas em uma colaboração, em uma unidade de processamento de sala limpa (CRPU) e em horas por segundo (com uma taxa mínima de 60 segundos). Ao usar o AWS Clean Rooms ML, você paga apenas pelos treinamentos de modelo que solicitou e pelos segmentos semelhantes criados com base no preço por 1.000 perfis. Para obter mais informações, consulte os preços do AWS Clean Rooms.

Com o AWS Entity Resolution no AWS Clean Rooms, você pode usar a correspondência baseada em regras ou em provedores de serviços de dados, aproveitando conjuntos de dados de provedores (como o LiveRamp).

Quando você usa a correspondência baseada em regras, pelo menos um membro de uma colaboração precisa preparar seus dados antes da correspondência com os conjuntos de dados dos seus parceiros, a menos que eles já tenham preparado seus dados usando o AWS Entity Resolution antes de criar ou ingressar na colaboração. Esse membro pagará pela preparação dos dados somente se eles forem usados. Qualquer membro que participe de uma colaboração pode pagar pela correspondência de dados. A correspondência de dados também exige uma taxa única por colaboração, e essa taxa é atribuída a qualquer colaborador que pague pela correspondência de dados.

Quando você usa a correspondência baseada em provedor de serviços de dados, todos os membros da colaboração precisam ter uma assinatura de provedor em vigor para preparar seus dados usando IDs de provedor. Todos os membros da colaboração devem preparar seus dados usando IDs de provedor antes de correspondê-los aos conjuntos de dados de seus parceiros, a menos que já tenham preparado seus dados usando o AWS Entity Resolution antes de criar ou ingressar na colaboração. Qualquer membro que participe de uma colaboração pode pagar pela correspondência de dados usando os IDs dos provedores. Além disso, o membro que paga pela correspondência de dados precisa ter uma assinatura de provedor em vigor. É possível usar as assinaturas públicas listadas no AWS Data Exchange (ADX) ou comprar uma assinatura privada diretamente com o provedor de serviços de dados de sua escolha e, em seguida, usar o recurso Traga sua própria assinatura (BYOS) para o ADX. 

Para obter mais informações, consulte os preços do AWS Entity Resolution no AWS Clean Rooms.

AWS Clean Rooms ML

O AWS Clean Rooms ML ajuda você e seus parceiros a aplicar modelos de ML em seus dados coletivos para desbloquear insights preditivos sem compartilhar informações confidenciais uns com os outros. Com esse recurso do AWS Clean Rooms, você pode convidar seus parceiros para uma sala limpa e aplicar um modelo de ML gerenciado e pronto para uso da AWS, o qual é treinado para cada colaboração para gerar conjuntos de dados semelhantes em apenas algumas etapas, economizando assim meses de trabalho de desenvolvimento para criar, treinar, ajustar e implantar seu próprio modelo.

O AWS Clean Rooms ML ajuda clientes com vários casos de uso. Por exemplo, uma companhia aérea pode reutilizar dados sobre seus clientes, colaborar com um serviço de reservas online e identificar possíveis viajantes com características semelhantes, locadoras e seguradoras de automóveis podem identificar possíveis clientes de seguros de automóveis que compartilham características com um conjunto de proprietários de locações existentes, e marcas e publicadores podem modelar segmentos semelhantes de clientes no mercado e oferecer experiências publicitárias altamente relevantes, sem que nenhuma empresa compartilhe seus dados subjacentes com as outras. A modelagem de assistência médica estará disponível nos próximos meses.

O AWS Clean Rooms ML foi criado e testado em vários conjuntos de dados, como comércio eletrônico e streaming de vídeo, e pode ajudar os clientes a melhorar a precisão de modelagem semelhante em até 36% em comparação com as referências representativas do setor. Em aplicações do mundo real, como prospecção de novos clientes, essa melhoria na precisão pode se traduzir em uma economia de milhões de dólares.

Com a modelagem semelhante ao AWS Clean Rooms ML, você pode treinar seu próprio modelo personalizado usando seus dados e convidar seus parceiros a trazer uma pequena amostra de seus registros para uma colaboração para gerar um conjunto expandido de registros semelhantes e, ao mesmo tempo, proteger os dados subjacentes que pertencem a você e seu parceiro. O AWS Clean Rooms ML coleta uma pequena amostra de registros de uma parte e encontra um conjunto muito maior de registros, ou segmento semelhante, do conjunto de dados de outro colaborador. O AWS Clean Rooms ML não compartilha dados com nenhuma das partes, e as partes poderão remover seus dados ou excluir um modelo personalizado sempre que quiserem. Você pode especificar o tamanho desejado do segmento semelhante resultante e o AWS Clean Rooms ML combinará privadamente os perfis exclusivos da sua lista de amostras com os do conjunto de dados do seu parceiro e, em seguida, treinará um modelo de ML capaz de prever a semelhança de cada perfil no conjunto de dados do seu colaborador com os da sua amostra. O AWS Clean Rooms ML agrupará automaticamente os perfis semelhantes à lista de amostras e gerará o segmento semelhante resultante. O AWS Clean Rooms ML elimina a necessidade de compartilhar dados para criar, treinar e implantar modelos de ML com seus parceiros. Com o AWS Clean Rooms ML, seus dados são usados somente para treinar seu modelo. Eles não são usados para treinar modelos da AWS. Você pode usar controles intuitivos que ajudam você e seus parceiros a ajustar os resultados preditivos do modelo.

Segurança e proteção de dados

A proteção dos dados começa com a base de segurança da AWS, e o AWS Clean Rooms é construído com base nos serviços de segurança da AWS, incluindo o AWS Identity and Access Management (IAM), o AWS Key Management Service (AWS KMS) e o AWS CloudTrail. Isso permite estender sua estratégia de proteção de dados existente às workloads de colaboração de dados. Com o AWS Clean Rooms, você não precisa mais armazenar ou manter uma cópia dos dados fora do ambiente da AWS e enviá-los a terceiros para realizar análises de insights do consumidor, medições de marketing, previsões ou avaliações de riscos.

Ao configurar uma colaboração do AWS Clean Rooms e usar a análise de SQL, é possível especificar habilidades diferentes para cada membro da colaboração de acordo com seus casos de uso específicos. Por exemplo, se você quiser que a saída da consulta seja direcionada para um membro diferente, defina um membro como o executor da consulta que pode escrever consultas e outro membro como o recebedor de resultados de consultas que pode apenas receber resultados. Isso dá ao criador da colaboração a capacidade de garantir que o membro que pode fazer consultas não tenha acesso aos resultados das consultas.

O AWS Clean Rooms também oferece controles de consultas de SQL que ajudam a proteger os dados permitindo que você restrinja os tipos de consultas ou especifique as consultas que podem ser executadas em suas tabelas de dados por meio da configuração de regras de análise. O AWS Clean Rooms é compatível com três tipos de regras de análise: agregação, listas e personalizada. Com a regra de análise de agregação, é possível configurar a tabela de forma que somente consultas que gerem estatísticas agregadas sejam permitidas (como medição ou atribuição de campanha). Com a regra de análise de listas, é possível configurar controles de forma que as consultas possam analisar somente a interseção de seus conjuntos de dados com os conjuntos de dados do membro que pode realizar consultas. Com a regra de análise personalizada, é possível configurar controles em nível de consulta para permitir que contas ou consultas específicas sejam executadas em seu conjunto de dados. Ao usar regras de análise personalizadas, você pode optar por usar o Differential Privacy. O AWS Clean Rooms Differential Privacy ajuda a proteger a privacidade dos seus usuários com controles intuitivos e baseados em matemática com apenas algumas etapas. Como um recurso totalmente gerenciado do AWS Clean Rooms, nenhuma experiência anterior com privacidade diferencial é necessária para ajudar você a evitar a reidentificação de seus usuários. Outro controle são os limites de agregação, os quais evitam que as consultas sejam reduzidas a grupos pequenos e potencialmente reidentificáveis.

Com o AWS Clean Rooms ML, seus dados são usados somente para treinar seu modelo. Eles não são usados para treinar modelos da AWS. O AWS Clean Rooms ML não usa dados de treinamentos ou de segmentos similares de nenhuma empresa com outra, e você pode excluir seus dados de modelo e treinamento sempre que desejar.

Não. Os conjuntos de dados são armazenados nas contas da AWS dos colaboradores. O AWS Clean Rooms lê temporariamente os dados das contas dos colaboradores para executar consultas, corresponder registros, treinar modelos de ML ou expandir segmentos semente. Os resultados de uma análise são enviados para o local do S3 projetado para a análise.

O AWS Entity Resolution no AWS Clean Rooms gera um conjunto de dados que mapeia os identificadores de cada parte em uma colaboração. O conjunto de dados de mapeamento é gerenciado pelo AWS Clean Rooms. Nenhum membro da colaboração pode visualizar ou baixar a tabela de mapeamento. Se todos os membros da colaboração concordarem em flexibilizar essa imposição de privacidade, a tabela de mapeamento poderá ser consultada para casos de uso específicos. Qualquer uma das partes pode excluir a tabela a qualquer momento.

Os modelos gerados pelo AWS Clean Rooms ML são armazenados pelo serviço, podem ser criptografados com uma chave do AWS KMS gerenciada pelo cliente e podem ser excluídos pelo cliente a qualquer momento.

As regras de criptografia e análise do AWS Clean Rooms permitem que você tenha controle granular sobre o tipo de informação que deseja compartilhar. Como colaborador de dados, você é responsável por avaliar o risco de cada colaboração, incluindo o risco de reidentificação, e realizar sua própria diligência devida adicional para garantir a conformidade com todas as leis de privacidade de dados. Se os dados que você está compartilhando forem confidenciais ou regulamentados, recomendamos que também use acordos legais apropriados e mecanismos de auditoria para reduzir ainda mais os riscos à privacidade.

Sim. Os Termos de serviço da AWS proíbem determinados casos de uso para colaborações no AWS Clean Rooms.

Sim. Sim, o programa de conformidade com a HIPAA da AWS inclui o AWS Clean Rooms como um serviço elegível para HIPAA. Se você assinou um Business Associate Agreement (BAA – Adendo de Associado Comercial) com a AWS, agora você pode usar o AWS Clean Rooms para criar colaborações em conformidade com a HIPAA. Se você não tiver um BAA ou tiver outras dúvidas sobre o uso da AWS para aplicações em conformidade com a HIPAA, entre em contato conosco para obter mais informações. Para saber mais, consulte Conformidade com a HIPAA da AWS e AWS para Saúde e ciências biológicas.

Análises de SQL

Nas regras de análise, você configura controles em nível de coluna que ajudam a definir como cada coluna pode ser usada em consultas. Por exemplo, você pode especificar quais colunas podem ser usadas para calcular estatísticas agregadas (como SUM(preço)) e quais colunas podem ser usadas para unir sua tabela com outros membros da colaboração. Na regra de análise de agregação, você também pode definir um limite mínimo de agregação que cada linha de saída deve atender. As linhas que não atendem ao limite mínimo são automaticamente deixadas de fora pelo AWS Clean Rooms.

Sim. Você poderá configurar o AWS Clean Rooms para publicar logs de consulta no Amazon CloudWatch Logs. Com a regra de análise personalizada, também é possível analisar as consultas (armazenadas em modelos de análise) antes que elas sejam executadas na colaboração. 

AWS Clean Rooms Differential Privacy

A privacidade diferencial é uma estrutura matematicamente comprovada para auxiliar na proteção da privacidade de dados. O principal benefício por trás da privacidade diferencial é ajudar a proteger os dados em nível individual, adicionando uma quantidade controlada de aleatoriedade — ruído — para obscurecer a presença ou ausência de qualquer indivíduo em um conjunto de dados que está sendo analisado.

O AWS Clean Rooms Differential Privacy ajuda a proteger a privacidade dos seus usuários com controles intuitivos e baseados em matemática com apenas algumas etapas. Como um recurso totalmente gerenciado do AWS Clean Rooms, nenhuma experiência anterior com privacidade diferencial é necessária para ajudar você a evitar a reidentificação de seus usuários. O AWS Clean Rooms Differential Privacy ofusca a contribuição dos dados de qualquer indivíduo na geração de insights agregados em colaborações para que você possa executar uma ampla variedade de consultas SQL para gerar insights sobre campanhas publicitárias, decisões de investimentos, pesquisas clínicas e muito mais.

É possível começar a usar o AWS Clean Rooms Differential Privacy em apenas algumas etapas após iniciar ou ingressar em uma colaboração do AWS Clean Rooms na condição de membro com habilidades para contribuir com dados. Depois de criar uma tabela configurada, que é uma referência à sua tabela no Catálogo de Dados do AWS Glue, basta optar por ativar a privacidade diferencial e adicionar uma regra de análise personalizada à tabela configurada. Em seguida, você associa a tabela configurada à sua colaboração com o AWS Clean Rooms e configura uma política de privacidade diferencial na colaboração para disponibilizar sua tabela para consulta. É possível usar uma política padrão para concluir rapidamente a configuração ou personalizá-la para atender às suas necessidades específicas.

Depois que a privacidade diferencial do AWS Clean Rooms estiver configurada, seu parceiro de colaboração poderá começar a executar consultas em sua mesa, sem exigir qualquer experiência em conceitos diferenciais de privacidade ou configuração adicional de seus parceiros. Com o AWS Clean Rooms Differential Privacy, os executores de consultas podem executar análises personalizadas e flexíveis, incluindo padrões de consulta complexos com expressões de tabela comuns (CTEs) e funções agregadas comumente usadas, como COUNT e SUM.

Computação criptográfica

Computação criptográfica é um método de proteger e criptografar dados confidenciais enquanto eles estão em uso. Os dados podem ser criptografados em repouso quando estão armazenados, em movimento quando são transmitidos e quando estão em uso. Criptografia significa converter dados de texto sem formatação em dados codificados que não podem ser decifrados sem uma "chave" específica. A interseção de conjuntos privados (PSI) é um tipo de computação criptográfica que permite que duas ou mais partes que possuem conjuntos de dados comparem versões criptografadas para realizar computação. A criptografia ocorre on-premises com a chave secreta compartilhada do colaborador.

O AWS Clean Rooms inclui computação criptográfica para Clean Rooms (C3R), que a opção de pré-criptografar dados usando uma ferramenta de criptografia do lado do cliente, um SDK ou uma interface de linha de comandos (CLI), que usa uma chave secreta compartilhada com os outros participantes de uma colaboração do AWS Clean Rooms. Isso criptografa os dados enquanto as consultas são executadas.