Mengapa harus Instans P5 Amazon EC2?
Instans P5 Amazon Elastic Compute Cloud (Amazon EC2), didukung oleh GPU NVIDIA H100 Tensor Core, dan instans P5e yang didukung oleh GPU NVIDIA H200 Tensor Core menghadirkan performa tertinggi di Amazon EC2 untuk aplikasi deep learning (DL) dan komputasi performa tinggi (HPC). Instans tersebut membantu Anda mempercepat waktu penyelesaian hingga 4x lipat dibandingkan instans EC2 berbasis GPU generasi sebelumnya dan mengurangi biaya untuk melatih model ML hingga 40%. Instans ini membantu Anda mengiterasi solusi Anda dengan lebih cepat dan memasuki pasar dengan lebih cepat. Anda dapat menggunakan instans P5 dan P5e untuk melatih dan melakukan deployment model bahasa besar (LLM) yang semakin kompleks dan model difusi yang mendukung aplikasi kecerdasan buatan (AI) generatif yang paling menuntut. Aplikasi ini termasuk penjawab pertanyaan, pembuatan kode, pembuatan video dan gambar, serta pengenalan suara. Anda juga dapat menggunakan instans ini untuk melakukan deployment aplikasi HPC yang menuntut dalam skala besar untuk penemuan farmasi, analisis seismik, prakiraan cuaca, dan pemodelan keuangan.
Untuk memberikan peningkatan performa dan penghematan biaya ini, instans P5 dan P5e melengkapi GPU NVIDIA P5e Tensor Core dengan performa CPU H100 dan H200 2x lebih tinggi, memori sistem 2x lebih tinggi, dan penyimpanan lokal 4x lebih tinggi dibandingkan instans berbasis GPU generasi sebelumnya. Instans ini memberikan kemampuan penskalaan ke luar terdepan di pasar untuk pelatihan terdistribusi dan beban kerja HPC yang digabungkan secara erat dengan jaringan hingga 3.200 Gbps menggunakan Elastic Fabric Adapter (EFAv2) generasi kedua. Untuk menghadirkan komputasi skala besar dengan latensi rendah, instans P5 dan P5e di-deploy di Amazon EC2 UltraClusters yang memungkinkan penskalaan hingga 20.000 GPU H100 atau H200. Instans ini saling terhubung dengan jaringan non-pemblokiran berskala petabita. Instans P5 dan P5e di EC2 UltraClusters dapat menghadirkan kemampuan komputasi agregat hingga 20 exaflop—performa yang setara dengan superkomputer.
Instans P5 Amazon EC2
Manfaat
Fitur
Testimoni pelanggan
Berikut adalah beberapa contoh cara pelanggan dan partner dalam mencapai tujuan bisnis mereka dengan instans P4 Amazon EC2.
-
Anthropic
Anthropic membangun sistem AI yang andal, dapat diinterpretasikan, dan dapat diarahkan yang akan banyak peluang untuk menciptakan nilai secara komersial dan bermanfaat bagi publik.
-
Cohere
Cohere, pelopor terkemuka dalam AI bahasa, mendorong setiap developer dan perusahaan untuk menciptakan produk luar biasa dengan teknologi pemrosesan bahasa alami (NLP) terdepan di dunia sekaligus menjaga privasi dan keamanan data mereka.
-
Hugging Face
Hugging Face memiliki misi untuk mendemokratisasi ML yang baik.
Detail produk
Ukuran Instans | vCPU | Memori Instans (TiB) | GPU | Memori GPU | Bandwidth Jaringan (Gbps) | GPUDirect RDMA | Peer to Peer GPU | Penyimpanan Instans (TB) | Bandwidth EBS (Gbps) |
---|---|---|---|---|---|---|---|---|---|
p5.48xlarge | 192 | 2 | 8 H100 | 640 GB HBM3 |
EFA 3.200 Gbps | Ya | 900 GB/s NVSwitch | 8 x 3.84 NVMe SSD | 80 |
p5e.48xlarge | 192 | 2 | 8 H200 | 1.128 GB HBM3e |
EFA 3.200 Gbps | Ya | 900 GB/s NVSwitch | 8 x 3.84 NVMe SSD | 80 |
Memulai kasus penggunaan ML
Memulai kasus penggunaan HPC
Instans P5 adalah platform yang ideal untuk menjalankan simulasi rekayasa, keuangan komputasional, analisis seismik, pemodelan molekul, genomik, rendering, dan beban kerja HPC berbasis GPU lainnya. Aplikasi HPC sering kali memerlukan performa jaringan yang tinggi, penyimpanan yang cepat, memori dalam jumlah besar, kemampuan komputasi tinggi, atau semua hal tersebut. Instans P5 mendukung EFAv2 yang memungkinkan aplikasi HPC menggunakan Antarmuka Pengalihan Pesan (MPI) untuk menskalakan hingga ribuan GPU. AWS Batch dan AWS ParallelCluster memungkinkan developer HPC membangun dan menskalakan aplikasi HPC terdistribusi dengan cepat.
Pelajari selengkapnya