Perché scegliere le istanze Amazon EC2 G5g?

Le istanze G5g di Amazon EC2, basate su processori AWS Graviton2, sono dotate di GPU NVIDIA T4G Tensor Core per offrire il miglior rapporto prezzo/prestazioni in Amazon EC2 per carichi di lavoro grafici come lo streaming di giochi Android. Sono le prime istanze basate su tecnologia ARM su un importante cloud dotate di accelerazione GPU.

Con le istanze G5g, i clienti dello streaming di giochi possono eseguire giochi Android in modo nativo su istanze basate su Arm, codificare la grafica renderizzata e trasmettere in streaming il gioco in rete su un dispositivo mobile. Ciò aiuta a ridurre lo sforzo di sviluppo eliminando la necessità di emulazione o compilazione incrociata e riduce il costo orario per flusso fino al 30%.

Le istanze G5g, inoltre, rappresentano una piattaforma conveniente per l'inferenza basata sul machine learning. Sono ideali per l'implementazione di applicazioni di deep learning che richiedono l'accesso alle GPU NVIDIA e alle relative librerie di IA.

Presentazione delle istanze Amazon EC2 G5g con tecnologia AWS Graviton2

Vantaggi

Con le istanze G5g, i clienti dello streaming di giochi possono eseguire giochi Android in modo nativo su istanze basate su Arm, codificare la grafica renderizzata e trasmettere il gioco in streaming tramite la rete su un dispositivo mobile senza la necessità di emulazione o compilazione incrociata. Questo contribuisce a semplificare le attività di sviluppo e a ridurre il time-to-market, riducendo al contempo il costo orario per flusso fino al 30%.

Le istanze G5g sono basate su processori AWS Graviton2 e sono dotate di GPU NVIDIA T4G Tensor Core per fornire inferenze di machine learning convenienti. Ciò contribuisce a ridurre il costo dell'infrastruttura per l'esecuzione di modelli di deep learning in produzione e consente a sviluppatori e aziende di implementare funzionalità di deep learning in modo più pervasivo nelle loro applicazioni.

Le istanze G5g sono dotate di processori AWS Graviton2 e basate su AWS Nitro System. I processori AWS Graviton2 dispongono della crittografia DRAM a 256 bit sempre attiva con prestazioni di crittografia per core più veloci del 50% rispetto alla prima generazione di processori AWS Graviton. AWS Nitro System è una combinazione di hardware dedicato e hypervisor leggero che fornisce tutte le risorse di elaborazione e di memoria dell'hardware host alle istanze per fornire prestazioni e sicurezza complessivamente migliori. Per impostazione predefinita, le istanze G5g supportano anche i volumi di archiviazione EBS crittografati.

I processori AWS Graviton, basati sull'architettura Arm a 64 bit, sono supportati da diversi sistemi operativi Linux tra cui Red Hat Enterprise Linux, SUSE e Ubuntu. Le istanze basate su AWS Graviton2 sono supportate anche da molte delle applicazioni e dei servizi più popolari per la sicurezza, il monitoraggio e la gestione, i container e CI/CD di AWS e dei fornitori di software indipendenti (ISV).

Caratteristiche

I processori AWS Graviton2 sono basati sui core Arm Neoverse a 64 bit e su processori personalizzati progettati da AWS per offrire prestazioni e costi ottimizzati. I nuovi processori AWS Graviton2 assicurano prestazioni 7 volte superiori, il quadruplo del numero di core di calcolo, memoria 5 volte più rapida e cache 2 volte più grandi rispetto alla prima generazione di processori AWS Graviton.

Le GPU NVIDIA T4G offrono prestazioni grafiche e di gioco migliorate se combinate con i processori AWS Graviton2. Con il supporto per la tecnologia NVIDIA RTX tramite core RT, consentono la renderizzazione con ray-tracing in tempo reale, offrendo oggetti e ambienti fotorealistici con ombre, riflessi e rifrazioni fisicamente accurate.

L'AWS Nitro System è una ricca raccolta di elementi costitutivi che consente di scaricare molte delle tradizionali funzioni di virtualizzazione su hardware e software dedicati per offrire elevate prestazioni, alta disponibilità e alta sicurezza riducendo al contempo il sovraccarico della virtualizzazione.

Dettagli del prodotto

Nome dell'istanza GPU Tensor Core T4G NVIDIA Memoria GPU (GB) vCPU Memoria (GB) Larghezza di banda EBS (Gb/s) Larghezza di banda di rete (Gb/s) Prezzo on demand/h* Prezzo all'ora effettivo per 1 anno di ISP (Linux) Prezzo all'ora effettivo per 3 anni di ISP (Linux)
g5g.xlarge 1 16 4 8 Fino a 3,5 Fino a 10 0,42 0,252 0,168
g5g.2xlarge 1 16 8 16 Fino a 3,5 Fino a 10 0,556 0,334 0,222
g5g.4xlarge 1 16 16 32 Fino a 3,5 Fino a 10 0,828 0,497 0,331
g5g.8xlarge 1 16 32 64 9 12 1,372 0,823 0,549
g5g.16xlarge 2 32 64 128 19 25 2,744 1,646 1,098
g5g.metal 2 32 64 128 19 25 2,744 1,646 1,098

Testimonianze dei clienti

Ecco alcuni esempi di come clienti e partner hanno raggiunto i propri obiettivi di agilità aziendale, rapporto prezzo/prestazioni, risparmio sui costi e sostenibilità con le istanze Amazon EC2 G5g.

  • now.gg

    “Noi di now.gg vogliamo offrire ai giocatori mobili le migliori esperienze indipendentemente dalle specifiche hardware dello smartphone”, ha dichiarato Rosen Sharma, Presidente e CEO di now.gg. "Offrire un servizio di gioco mobile basato su cloud presenta due sfide. La prima è di carattere tecnico: per i giochi mobili sono necessarie GPU potenti e CPU basate su Arm che lavorino insieme. La seconda sfida è essere in grado di offrire i giochi mobili a un prezzo che renda redditizia l'attività. Le istanze Amazon EC2 G5g rappresentano un passo avanti importante in entrambe queste dimensioni e abbiamo lavorato a stretto contatto con AWS per eseguire NowCloudOS su istanze G5g per offrire questi vantaggi ai giochi mobili.

    Rosen Sharma, Presidente e CEO di now.gg
  • Modulate

    Nelle community di videogiochi, la chat vocale è essenziale per la socializzazione e il coinvolgimento, ma soffre di una tossicità dilagante che danneggia i giocatori e aumenta il tasso di abbandono. Modulate utilizza il machine learning per rilevare in modo proattivo le molestie e altri episodi spiacevoli nelle conversazioni vocali dal vivo, creando un luogo più sicuro e inclusivo in cui i giocatori possono giocare. Le istanze Amazon EC2 G5g sono un tassello essenziale nella capacità di Modulate di offrire una tecnologia di moderazione vocale conveniente in tempo reale e hanno ridotto fino al 70% i costi di inferenza di machine learning.

    Carter Huffman, CTO e Co-fondatore, Modulate
  • Arm

    Lo sviluppo di software integrati per le funzioni definite dal software automobilistico come ADAS, guida autonoma e infotainment è posto di fronte a varie sfide. Le differenze tra l'ambiente di sviluppo e l'edge rallentano l'innovazione e il time-to-market a causa della necessità di compilare e riconvalidare lo stack software tra le piattaforme hardware. Utilizzando il framework SOAFEE in esecuzione sulle istanze G5g di Amazon EC2, con processori CPU Graviton2 basati su Arm e GPU Nvidia T4G Tensor Core, gli sviluppatori del settore automobilistico possono essere certi di conseguire uno stretto allineamento, o parità ambientale, tra auto e cloud.

    John Heinlein, Vicepresidente, Automotive Partnerships - Nord America, Arm
  • Canonical

    Canonical ha lanciato Anbox Cloud Appliance nell'AWS Marketplace per offrire agli sviluppatori un modo semplice per prototipare, sviluppare ed eseguire Android nel cloud. Ora Anbox Cloud supporta le istanze G5g di Amazon EC2 e fornisce una soluzione completa che funziona alla perfezione con lo stack software Android per virtualizzare le app per dispositivi mobili, inclusi i giochi, e trasmetterle in streaming ai dispositivi mobili in modo sicuro e su larga scala. Con le istanze Anbox Cloud e G5g, i clienti possono trasmettere in streaming fino a 55 sessioni individuali a 720p e 30 fps con costi fino al 20% inferiori rispetto alle istanze GPU basate su x86 con specifiche comparabili.

    Simon Fels, Engineering Manager di Anbox, Canonical
  • Corellium

    La sfida dello sviluppo di software per dispositivi mobili è che i dispositivi fisici non sono scalabili, ma gli emulatori non forniscono le stesse prestazioni o la medesima precisione. Corellium crea modelli virtuali di dispositivi basati su Arm e li esegue su server basati su Arm nel cloud. Con le istanze Amazon EC2 G5g, gli sviluppatori mobili possono sfruttare il software Corellium per creare dispositivi Android virtuali nativi Arm che combinano la fedeltà e le prestazioni di un dispositivo reale con la praticità e la scalabilità del cloud.

    Chris Wade, CTO, Corellium
  • Genymobile

    Genymobile offre Genymotion, una soluzione Android-as-a-Service, a un prezzo accessibile. Con il rilascio delle istanze G5g di Amazon EC2, siamo in grado di fare un ulteriore passo avanti fornendo agli sviluppatori un ambiente nativo Arm con accelerazione hardware, che consente la renderizzazione e la codifica video accelerati dalla GPU. Genymotion su G5g è l'immagine Android più veloce e precisa che abbiamo rilasciato finora. Inoltre, la nostra implementazione a basso impatto ambientale ci consente di eseguire oltre 60 istanze di dispositivi virtuali su un singolo server G5g.

    Jean-Charles Leneveu, Product Manager, Genymobile
  • Tier IV

    Tier IV è il principale sviluppatore di Autoware, il primo software open source al mondo per la guida autonoma. Come parte del nostro ciclo CI/CD, in precedenza ci limitavamo a valutare le prestazioni del nostro modello di machine learning Yolo4 sul nostro hardware ROScube di bordo. Ciò limitava il numero di simulazioni che potevano essere eseguite contemporaneamente. Poiché le istanze G5g sono dotate dei processori e delle GPU Graviton2 basati su Arm, siamo in grado di sfruttare queste istanze per dimensionare la nostra pipeline CI/CD ed eseguire molte più iterazioni di simulazioni contemporaneamente, con un allineamento senza precedenti tra cloud e sistemi integrati.

    Eiji Sekiya, Director of Engineering, Tier IV
  • Ready Player One

    In WePlay, miriamo a creare mondi virtuali nativi del cloud, decentralizzati e personaggi altamente identificabili. Siamo una piattaforma di videogiochi nel cloud, ma non soltanto. Utilizziamo la tecnologia di videogiochi nel cloud per offrire a tutti i giocatori mobili un'esperienza social senza precedenti. La sfida più grande che abbiamo incontrato è stata la compatibilità dei file apk basati su Arm con le attuali istanze abilitate per GPU basate su x86. Tradurre file basati su Arm in x86 ed eseguirli su istanze x86, oltra a essere più costoso, è anche inefficace. Con le istanze g5g, possiamo eseguire giochi Android in modo nativo senza un livello di traduzione. Abbiamo ridotto i costi di circa il 30% rispetto alle istanze G4dn.

    Adrian Wang, CEO, Ready Player One Tech

Datasheet

GPU tensor core NVIDIA T4G: grafica accelerata e IA per il cloud AWS basato su ARM.

Scopri di più

AWS On Air Istanze G5g di Amazon EC2

Nozioni di base sulle istanze G5g

Con le Amazon Deep Learning AMI è possibile avviare rapidamente istanze Amazon EC2 con framework preinstallati di deep learning tra i più comuni, come TensorFlow e PyTorch, per eseguire modelli di IA sofisticati e personalizzati, sperimentare con nuovi algoritmi o apprendere nuove competenze e tecniche. Per ulteriori informazioni, visita la pagina del prodotto di Amazon Deep Learning AMI.

L'AMI NVIDIA Deep Learning sull'AWS Marketplace è preconfigurata con tutti i driver, le librerie e le dipendenze NVIDIA necessari per eseguire il software compatibile con Arm del catalogo NGC, l'hub di software ottimizzato per GPU di NVIDIA. Scopri di più sull'utilizzo del catalogo NGC di NVIDIA su AWS.

I driver NVIDIA Data Center forniscono le migliori prestazioni per i carichi di lavoro computazionali altamente intensivi spesso presenti in deep learning, data science e calcolo ad alte prestazioni (HPC). Per sapere come installare questi driver sulla tua istanza, fai clic qui.