Por que usar as instâncias P4 do Amazon EC2?
As instâncias P4d do Amazon Elastic Compute Cloud (Amazon EC2) fornecem alta performance para treinamento de machine learning (ML) e aplicações de computação de alta performance (HPC) na nuvem. As instâncias P4d estão equipadas com GPUs NVIDIA A100 Tensor Core e oferecem alto throughput e redes com baixa latência que são líderes do setor. Essas instâncias oferecem suporte a redes de instâncias de 400 Gbps. As instâncias P4d oferecem custo até 60% inferior para treinar modelos de ML, inclusive uma média de performance 2,5 vezes melhor para modelos de aprendizado profundo em comparação com as instâncias P3 e P3dn da geração anterior.
As instâncias P4d são implantadas em clusters de hiperescala chamados Amazon EC2 UltraClusters, compostos pela mais alta performance de computação, redes e armazenamento na nuvem. Cada EC2 UltraCluster é um dos supercomputadores mais poderosos do mundo, que ajuda a executar seus mais complexos treinamentos de ML de vários nós e workloads de HPC distribuídas. Você pode escalar com facilidade de algumas a milhares de GPUs NVIDIA A100 nos EC2 UltraClusters com base em suas necessidades de projeto de ML ou HPC.
Pesquisadores, cientistas de dados e desenvolvedores podem usar instâncias P4d para treinar modelos de ML para casos de uso, como processamento de linguagem natural, detecção e classificação de objetos e mecanismos de recomendação. Também podem ser usadas para executar aplicações de HPC, como descoberta farmacêutica, análise sísmica e modelagem financeira. Ao contrário dos sistemas on-premises, você pode acessar capacidade virtualmente ilimitada de computação e armazenamento, escalar a infraestrutura com base nas necessidades de negócios e ativar um trabalho de treinamento de ML de vários nós ou uma aplicação de HPC distribuída fortemente acoplada em minutos, sem custos de configuração ou de manutenção.
Anúncio das novas instâncias P4d do Amazon EC2
Benefícios
Recursos
Depoimentos de clientes
Aqui estão alguns exemplos de como clientes e parceiros alcançaram suas metas de negócios com as instâncias P4 do Amazon EC2.
-
Toyota Research Institute (TRI)
Fundado em 2015, o Toyota Research Institute (TRI) está trabalhando para desenvolver direção automatizada, robótica e outras tecnologias de amplificação humana para a Toyota.
-
TRI-AD
-
TRI-AD
-
GE Healthcare
A GE Healthcare é líder global em tecnologia médica e inova em soluções digitais. A GE Healthcare permite que os profissionais de saúde tomem decisões mais rápidas e embasadas usando dispositivos inteligentes, análise de dados, aplicações e serviços, com o suporte de sua plataforma de inteligência Edison.
-
HEAVY.AI
A HEAVY.AI é pioneira em análise acelerada. A plataforma HEAVY.AI é usada em empresas e agências governamentais para encontrar insights em dados além dos limites das ferramentas de análise convencionais.
-
Zenotech Ltd.
A Zenotech Ltd está redefinindo a engenharia on-line usando nuvens de HPC que oferecem modelos de licenciamento sob demanda, juntamente com benefícios de performance extremos utilizando as GPUs.
-
Aon
A Aon é uma empresa líder global de serviços profissionais que oferece uma ampla variedade de soluções de risco, aposentadoria e saúde. A Aon PathWise é uma solução de gerenciamento de risco de HPC escalável e baseada em GPU que seguradoras e resseguradoras, bancos e fundos de pensão podem usar para enfrentar os principais desafios atuais, como testes de estratégia de hedge, previsão regulatória e econômica e orçamento.
-
Rad AI
Formada por especialistas em radiologia e IA, a Rad AI desenvolve produtos que maximizam a produtividade do radiologista, tornando os cuidados de saúde mais acessíveis e melhorando os resultados do paciente. Leia o estudo de caso para saber mais
Detalhes do produto
Tamanho da instância | vCPUs | Memória da instância (GiB) | GPU: A100 | Memória de GPU | Largura de banda de rede (Gbps) | RDMA GPUDirect | Peer-to-peer de GPUs | Armazenamento de instâncias (GB) | Largura de banda do EBS (Gbps) | Preço/hr sob demanda | Instância reservada por 1 ano – por hora * | Instância reservada por 3 anos – por hora * |
---|---|---|---|---|---|---|---|---|---|---|---|---|
p4d.24xlarge | 96 | 1.152 | 8 | 320GB HBM2 |
ENA e EFA de 400 | Sim | NVSwitch de 600 GB/s | 8 x 1000 NVMe SSD | 19 | USD 32,77 | USD 19,22 | USD 11,57 |
p4de.24xlarge (pré-visualização) | 96 | 1.152 | 8 | 640 GB HBM2e |
ENA e EFA de 400 | Sim | NVSwitch de 600 GB/s | 8 x 1000 NVMe SSD | 19 | USD 40,96 | USD 24,01 | USD 14,46 |
As instâncias P4d estão disponíveis nas regiões: Leste dos EUA (N. da Virgínia e Ohio), Oeste dos EUA (Oregon), Ásia-Pacífico (Seul e Tóquio) e Europa (Frankfurt e Irlanda). As instâncias P4de estão disponíveis nas regiões Leste dos EUA (N. da Virgínia) e Oeste dos EUA (Oregon).
Os clientes podem adquirir instâncias P4d e P4de como instâncias sob demanda, instâncias reservadas, instâncias spot, hosts dedicados ou parte de um Savings Plan.
Conceitos básicos de instâncias P4d para ML
Conceitos básicos de instâncias P4d para HPC
As instâncias P4d são ideais para executar simulações de engenharia, finanças computacionais, análise sísmica, modelagem molecular, genômica, renderização e outras workloads de HPC baseadas em GPUs. Geralmente, os aplicativos de HPC exigem redes de alta performance, armazenamento rápido, grandes quantidades de memória, recursos elevados de computação ou todos esses itens. As instâncias P4d oferecem suporte EFA, possibilitando que aplicações de HPC usem a Message Passing Interface (MPI) para escalar milhares de GPUs. O AWS Batch e o AWS ParallelCluster ajudam desenvolvedores de HPC a desenvolver e escalar rapidamente aplicações de HPC distribuídas.