¿Por qué elegir las instancias G5g de Amazon EC2?

Las instancias G5g de Amazon EC2 cuentan con tecnología de procesadores AWS Graviton2 y cuentan con GPU NVIDIA T4G Tensor Core para ofrecer la mejor relación precio-rendimiento en Amazon EC2 para cargas de trabajo gráficas como el streaming de juegos de Android. Son las primeras instancias basadas en Arm en una nube importante que cuentan con aceleración de GPU.

Con las instancias G5g, los clientes de streaming de juegos pueden ejecutar juegos de Android de forma nativa en instancias basadas en Arm, codificar los gráficos representados y hacer streaming del juego a través de la red a un dispositivo móvil. Esto ayuda a reducir el esfuerzo de desarrollo, ya que se elimina la necesidad de emulaciones o compilaciones cruzadas, y reduce el costo por streaming por hora hasta en un 30 %.

Las instancias G5g también son una plataforma rentable para los modelos de inferencia de machine learning. Son ideales para implementar aplicaciones de aprendizaje profundo que necesitan acceso a las GPU NVIDIA y sus bibliotecas de IA asociadas.

Introducing Amazon EC2 G5g Instances Powered by AWS Graviton2

Beneficios

Con las instancias G5g, los clientes de streaming de juegos pueden ejecutar juegos de Android de forma nativa en instancias basadas en Arm, codificar los gráficos representados y hacer streaming del juego a través de la red a un dispositivo móvil, sin la necesidad de emulaciones o compilaciones cruzadas. Esto ayuda a simplificar el esfuerzo de desarrollo y a reducir el tiempo de comercialización, a la vez que reduce el costo por transmisión por hora hasta en un 30 %.

Las instancias G5g cuentan con tecnología de procesadores AWS Graviton2 y cuentan con GPU NVIDIA T4G Tensor Core para proporcionar inferencia de machine learning rentable. Esto ayuda a reducir el costo de infraestructura de la ejecución de modelos de aprendizaje profundo en producción y permite a los desarrolladores y las empresas implementar capacidades de aprendizaje profundo de manera más generalizada en sus aplicaciones.

Las instancias G5g cuentan con tecnología de procesadores AWS Graviton2 y están basadas en AWS Nitro System. Los procesadores AWS Graviton2 cuentan con un rendimiento de cifrado por núcleo del 50 % y cifrado DRAM de 256 bits de funcionamiento continuo en comparación con AWS Graviton de primera generación. AWS Nitro System es una combinación de hardware exclusivo e hipervisor ligero que proporciona prácticamente todos los recursos de computación y de memoria del hardware del host a sus instancias para ofrecer una mejor seguridad y rendimiento general. Las instancias G5g también admiten volúmenes de almacenamiento de EBS cifrados de manera predeterminada.

Los procesadores AWS Graviton, basados en la arquitectura de Arm de 64 bits, son compatibles con varios sistemas operativos de Linux conocidos, como Red Hat Enterprise Linux, SUSE y Ubuntu. Muchas aplicaciones y servicios populares de seguridad, supervisión y administración, contenedores y CI/CD de AWS y proveedores de software independientes (ISV) también son compatibles con instancias basadas en AWS Graviton2.

Características

Los procesadores AWS Graviton2 se basan en núcleos Neoverse Arm de 64 bits y componentes a medida diseñados por AWS que ofrecen rendimiento y costo optimizados. Los procesadores Graviton2 de AWS ofrecen un rendimiento 7 veces mayor, 4 veces más núcleos informáticos, una memoria 5 veces más rápida y cachés el doble de grandes en comparación con los procesadores Graviton de AWS de primera generación.

Las GPU NVIDIA T4G ofrecen un rendimiento gráfico y de juegos mejorado cuando se combinan con los procesadores AWS Graviton2. Al ser compatibles con la tecnología NVIDIA RTX a través de los núcleos RT, permiten renderizar con trazado de rayos en tiempo real, lo que proporciona objetos y entornos fotorrealistas con sombras, reflejos y refracciones físicamente precisos.

AWS Nitro System es una amplia colección de bloques fundamentales que descargan muchas de las funciones de virtualización tradicionales a hardware y software dedicados para ofrecer alto rendimiento, alta disponibilidad y alta seguridad, al tiempo que reduce la sobrecarga de la virtualización.

Detalles del producto

Nombre de la instancia GPU NVIDIA T4G Tensor Core Memoria de GPU (GB) vCPU Memoria (GB) Ancho de banda de EBS (Gbps) Ancho de banda de la red (Gbps) Precio de la instancia bajo demanda por hora* ISP de 1 año efectivo por hora (Linux) ISP de 3 años efectivo por hora (Linux)
g5g.xlarge 1 16 4 8 Hasta 3,5 Hasta 10 0,42 0,252 0,168
g5g.2xlarge 1 16 8 16 Hasta 3,5 Hasta 10 0,556 0,334 0,222
g5g.4xlarge 1 16 16 32 Hasta 3,5 Hasta 10 0,828 0,497 0,331
g5g.8xlarge 1 16 32 64 9 12 1,372 0,823 0,549
g5g.16xlarge 2 32 64 128 19 25 2,744 1,646 1,098
g5g.metal 2 32 64 128 19 25 2,744 1,646 1,098

Testimonios de clientes

Estos son algunos ejemplos de cómo clientes y socios han logrado sus objetivos de agilidad empresarial, rentabilidad, ahorro de costos y sostenibilidad con las instancias G5g de Amazon EC2.

  • now.gg

    En now.gg, queremos ofrecer a los jugadores de móvil las mejores experiencias, independientemente de las especificaciones de hardware de sus teléfonos inteligentes”, dijo Rosen Sharma, President y CEO de now.gg. “Ofrecer un servicio de juegos de móvil basado en la nube plantea dos desafíos. El primer desafío es técnico: para los juegos de móvil, se necesitan GPU potentes y CPU basadas en Arm que funcionen juntas. El segundo desafío es poder ofrecer juegos de móvil a un precio que haga que el negocio sea viable. Las instancias G5g de Amazon EC2 representan un gran avance en estas dos dimensiones, y hemos estado trabajando en estrecha colaboración con AWS para ejecutar NowCloudOS sobre instancias G5g para llevar estas ventajas a los juegos de móvil.

    Rosen Sharma, President y CEO de now.gg
  • Modulate

    El chat de voz en las comunidades de videojuegos es esencial para la socialización y la participación, pero presenta una toxicidad generalizada que perjudica a los jugadores y aumenta la pérdida de clientes. Modulate utiliza el machine learning para detectar de forma proactiva el acoso y otros daños en las conversaciones de voz en directo, lo que crea un lugar más seguro e inclusivo para que los jugadores jueguen. Las instancias G5g de Amazon EC2 son una columna vertebral esencial de la capacidad de Modulate de ofrecer una tecnología de moderación de voz rentable en tiempo real, y han reducido nuestros costos de inferencia de machine learning hasta en un 70 %.

    Carter Huffman, CTO y Co-founder de Modulate
  • Arm

    El desarrollo de software integrado para funciones definidas por software de automoción, como ADAS, conducción autónoma e información y entretenimiento, presenta desafíos. Las diferencias entre el entorno de desarrollo y la periferia ralentizan la innovación y el tiempo de comercialización debido a la necesidad de compilar de forma cruzada y revalidar la pila de software entre las plataformas de hardware. Al emplear el marco SOAFEE que se ejecuta en instancias G5g de Amazon EC2, con tecnología de CPU Graviton2 basadas en ARM y GPU Nvidia T4G Tensor Core, los desarrolladores de automoción pueden confiar en una estrecha alineación o paridad ambiental entre el automóvil y la nube.

    John Heinlein, Vice President, Automotive Partnerships - North America, Arm
  • Canonical

    Canonical lanzó Anbox Cloud Appliance en AWS Marketplace para ofrecer a los desarrolladores una forma sencilla de crear prototipos, desarrollar y ejecutar Android en la nube. Anbox Cloud ahora es compatible con las instancias G5g de Amazon EC2 y proporciona una solución completa que funciona a la perfección con la pila de software de Android para virtualizar aplicaciones móviles, incluidos los juegos, y transmitirlas de forma segura a escala a dispositivos móviles. Con las instancias de Anbox Cloud y G5g, los clientes pueden transmitir hasta 55 sesiones individuales a 720p y 30 fps con un costo hasta un 20 % inferior en comparación con instancias de GPU basadas en x86 comparables.

    Simon Fels, Engineering Manager for Anbox de Canonical
  • Corellium

    El desafío de desarrollar software para dispositivos móviles es que los dispositivos físicos no se escalan, pero los emuladores no proporcionan el mismo rendimiento o precisión. Corellium crea modelos virtuales de dispositivos basados en Arm y los ejecuta en servidores basados en Arm en la nube. Con las instancias G5g de Amazon EC2, los desarrolladores móviles pueden aprovechar el software de Corellium para crear dispositivos Android virtuales nativos en Arm que combinan la fidelidad y el rendimiento de un dispositivo real con la comodidad y la escalabilidad de la nube.

    Chris Wade, CTO de Corellium
  • Genymobile

    Genymobile ofrece Genymotion, una solución de Android como servicio a un precio asequible. Con el lanzamiento de las instancias G5g de Amazon EC2, podemos ir un paso más allá al ofrecer a los desarrolladores un entorno nativo en Arm con aceleración de hardware, lo que permite la codificación de video y la renderización aceleradas por GPU. Genymotion en G5g es nuestra imagen de Android más rápida y precisa hasta ahora. Además de eso, nuestra implementación de bajo consumo de recursos nos permite ejecutar más de 60 instancias de dispositivos virtuales en un solo servidor G5g.

    Jean-Charles Leneveu, Product Manager de Genymobile
  • Tier IV

    Tier IV es el desarrollador líder de Autoware, el primer software de código abierto del mundo para la conducción autónoma. Como parte de nuestro ciclo de CI/CD, anteriormente nos limitábamos a evaluar el rendimiento de nuestro modelo de machine learning Yolo4 en el hardware ROScube para automóviles. Esto ha restringido la cantidad de simulaciones que podrían ejecutarse simultáneamente. Dado que las instancias G5g cuentan con las GPU y el procesador Graviton2 basados en Arm, podemos aprovechar estas instancias para escalar nuestra cartera de CI/CD y ejecutar muchas más iteraciones de simulaciones de forma simultánea, con una paridad sin precedentes entre los sistemas integrados y en la nube.

    Eiji Sekiya, Director of Engineering, Tier IV
  • Ready Player One

    En WePlay, nuestro objetivo es crear mundos virtuales nativos en la nube, descentralizados e identificables por personajes. Somos una plataforma de juegos en la nube, pero no solo una plataforma de juegos en la nube. Utilizamos la tecnología de juegos en la nube para ofrecer a todos los jugadores de móvil una experiencia social sin igual. El mayor desafío al que nos enfrentamos fue la compatibilidad de los archivos apk basados en Arm con las instancias actuales compatibles con GPU basadas en x86 disponibles. Traducir archivos basados en Arm a x86 y ejecutarlos en instancias x86 no solo es más costoso, sino también ineficaz. Con las instancias g5g, podemos ejecutar juegos de Android de forma nativa sin una capa de traducción. Redujimos nuestros costos en aproximadamente un 30 % en comparación con g4dn.

    Adrian Wang, CEO de Ready Player One Tech

Hoja de datos

GPU NVIDIA T4G Tensor Core: IA y gráficos acelerados para la nube de AWS basados en Arm.

Más información

AWS On Air ft. Instancias G5g de Amazon EC2

Introducción a las instancias G5g

Al utilizar AMI de aprendizaje profundo de Amazon, puede lanzar rápidamente instancias de Amazon EC2 preinstaladas con marcos e interfaces populares de aprendizaje profundo, como TensorFlow y PyTorch, para ejecutar modelos de IA personalizados y sofisticados, probar algoritmos nuevos o aprender nuevas técnicas o habilidades. Para obtener más información, consulte la página del producto AMI de aprendizaje profundo de Amazon.

La AMI de aprendizaje profundo de NVIDIA en AWS Marketplace viene preconfigurada con todos los controladores, bibliotecas y dependencias de NVIDIA necesarios para ejecutar software compatible con Arm del catálogo NGC, el centro de software optimizado para GPU de NVIDIA. Obtenga más información sobre el uso del catálogo NGC de NVIDIA en AWS.

Los controladores del centro de datos de NVIDIA ofrecen el mejor rendimiento para las cargas de trabajo de computación muy intensiva que se suelen encontrar en el aprendizaje profundo, la ciencia de datos y la computación de alto rendimiento (HPC). Para obtener información sobre cómo instalar estos controladores en la instancia, haga clic aquí.