مثيلات Amazon EC2 P4

أداء عالٍ لتدريب تعلم الآلة (ML) وتطبيقات الحوسبة عالية الأداء (HPC) في السحابة

ما سبب أهمية مثيلات Amazon EC2 P4؟

توفر مثيلات Amazon Elastic Compute Cloud (Amazon EC2) P4d أداءً عاليًا للتدريب على تعلم الآلة (ML) وتطبيقات الحوسبة عالية الأداء (HPC) في السحابة. يتم تشغيل مثيلات P4d بواسطة أحدث وحدات معالجة الرسومات NVIDIA A100 Tensor Core GPUs وتوفر شبكة رائدة في الصناعة ذات سرعة عالية وزمن انتقال منخفض. تدعم هذه المثيلات شبكات مثيلات بسرعة 400 جيجابت في الثانية. توفر مثيلات P4d تكلفة أقل بنسبة تصل إلى 60% لتدريب نماذج تعلم الآلة (ML)، بما في ذلك متوسط أداء أفضل بمقدار 2.5 مرة لنماذج التعلم العميق مقارنة بمثيلات P3 وP3dn من الجيل السابق.

يتم نشر مثيلات P4d في مجموعات فائقة النطاق تسمى مجموعات Amazon EC2 UltraClusters والتي تشتمل على الحوسبة عالية الأداء والشبكات والتخزين في السحابة. يعد كل جهاز EC2 UltraCluster واحدًا من أقوى أجهزة الكمبيوتر العملاقة في العالم، مما يساعدك على تشغيل أكثر تدريبات تعلم الآلة (ML) متعددة العقد تعقيدًا وأحمال عمل الحوسبة عالية الأداء (HPC) الموزعة. يمكنك بسهولة التوسع من بضعة إلى آلاف من وحدات معالجة الرسومات NVIDIA A100 GPUs في مجموعات EC2 UltraClusters بناءً على احتياجات مشروع تعلم الآلة (ML) أو الحوسبة عالية الأداء (HPC).

يمكن للباحثين وعلماء البيانات والمطورين استخدام مثيلات P4d لتدريب نماذج تعلم الآلة (ML) لحالات الاستخدام مثل معالجة اللغة الطبيعية واكتشاف الكائنات وتصنيفها ومحركات التوصية. يمكنهم أيضًا استخدامه لتشغيل تطبيقات الحوسبة عالية الأداء (HPC) مثل الاكتشاف الصيدلاني وتحليل الزلازل والنمذجة المالية. على عكس الأنظمة المحلية، يمكنك الوصول إلى سعة حوسبة وتخزين غير محدودة تقريبًا، وتوسيع نطاق البنية التحتية الخاصة بك استنادًا إلى احتياجات العمل، وإنجاز مهمة تدريب تعلم الآلة متعددة الوحدات أو تطبيق الحوسبة عالية الأداء (HPC) الموزع بإحكام في دقائق، دون أي تكاليف إعداد أو صيانة.

الإعلان عن مثيلات Amazon EC2 P4d الجديدة

الفوائد

مع أحدث جيل من وحدات معالجة الرسومات NVIDIA A100 Tensor Core GPUs، يوفر كل مثيل P4d في المتوسط أداء تعلم عميق (DL) أفضل بمعدل 2.5 مرة مقارنة بمثيلات P3 من الجيل السابق. تساعد EC2 UltraClusters لمثيلات P4d المطورين العاديين وعلماء البيانات والباحثين على إدارة أعباء عمل تعلم الآلة (ML) والحوسبة عالية الأداء (HPC) الأكثر تعقيدًا من خلال إتاحة الوصول إلى أداء من فئة الحوسبة الفائقة دون أي تكاليف مسبقة أو التزامات طويلة الأجل. يعمل وقت التدريب المنخفض مع مثيلات P4d على تعزيز الإنتاجية، مما يساعد المطورين على التركيز على مهمتهم الأساسية المتمثلة في بناء ذكاء تعلم الآلة (ML) في تطبيقات الأعمال.

يمكن للمطورين التوسع بسلاسة إلى ما يصل إلى آلاف وحدات معالجة الرسومات (GPUs) باستخدام EC2 UltraClusters لمثيلات P4d. تساعد الشبكات عالية السرعة وذات زمن الاستجابة المنخفض مع دعم شبكات المثيلات بسرعة 400 جيجابت في الثانية ومحول Elastic Fabric Adapter‏ (EFA) وتقنية GPUDirect RDMA في تدريب نماذج تعلم الآلة (ML) بسرعة باستخدام تقنيات التوسع/التوزيع. تستخدم EFA مكتبة NVIDIA للاتصالات الجماعية (NCCL) للتوسع إلى آلاف وحدات معالجة الرسومات (GPUs)، وتتيح تقنية GPUDirect RDMA الاتصال من وحدة GPU إلى GPU بزمن انتقال منخفض بين مثيلات P4d.

توفر مثيلات P4d تكلفة أقل بنسبة تصل إلى 60% لتدريب نماذج تعلم الآلة (ML) مقارنة بمثيلات P3. بالإضافة إلى ذلك، تتوفر مثيلات P4d للشراء كمثيلات Spot. تستفيد مثيلات Spot من سعة مثيل EC2 غير المستخدمة ويمكنها خفض تكاليف EC2 بشكل كبير مع خصم يصل إلى 90% من الأسعار عند الطلب. مع انخفاض تكلفة تدريب تعلم الآلة (ML) مع مثيلات P4d، يمكن إعادة تخصيص الميزانيات لبناء المزيد من ذكاء تعلم الآلة (ML) في تطبيقات الأعمال.

تعمل AWS Deep Learning AMIs (DLAMIs) وحاويات Amazon Deep Learning Containers على تسهيل نشر بيئات P4d DL في دقائق لأنها تحتوي على المكتبات والأدوات المطلوبة الخاصة بإطار التعلم العميق (DL). يمكنك أيضًا إضافة المكتبات والأدوات إلى هذه الصور بسهولة أكبر. تدعم مثيلات P4d أطر تعلم الآلة (ML) الشائعة، مثل TensorFlow وPyTorch وMXNet. بالإضافة إلى ذلك، يتم دعم مثيلات P4d بواسطة خدمات AWS الرئيسية لتعلم الآلة (ML) والإدارة والتنسيق، مثل Amazon SageMaker وخدمة Amazon Elastic Kubernetes‏ (Amazon EKS) وخدمة Amazon Elastic Container Service‏ (Amazon ECS) وخدمة AWS Batch وAWS ParallelCluster.

المزايا

توفر وحدات معالجة الرسومات NVIDIA A100 Tensor Core GPUs تسريعًا غير مسبوق على نطاق واسع لتعلم الآلة (ML) والحوسبة عالية الأداء (HPC). الجيل الثالث من Tensor Cores التابع لـ NVIDIA A100 يعمل على تسريع كل عبء عمل دقيق، مما يؤدي إلى تسريع وقت الرؤية ووقت الوصول إلى السوق. توفر كل وحدة معالجة رسومات A100 GPU أكثر من 2.5 ضعف أداء الحوسبة مقارنة بالجيل السابق من وحدة معالجة الرسومات V100 GPU وتأتي مع 40 جيجابايت من HBM2 (في مثيلات P4d) أو 80 جيجابايت من HBM2e (في مثيلات P4de) من ذاكرة GPU عالية الأداء. ذاكرة GPU العالية تستفيد بشكل خاص من أعباء العمل التي تتدرب على مجموعات بيانات كبيرة من البيانات عالية الدقة. تستخدم وحدات معالجة الرسومات NVIDIA A100 GPUs سرعة التوصيل البيني لوحدة معالجة الرسومات NVSwitch GPU بحيث يمكن لكل وحدة معالجة رسومات (GPU) الاتصال مع كل وحدة معالجة رسومات أخرى في نفس الحالة بنفس سرعة ثنائي الاتجاه التي تبلغ 600 جيجابت/ثانية وبزمن انتقال أحادي الخطوة.

مثيلات P4d توفر شبكات بسرعة 400 جيجابت في الثانية لمساعدة العملاء على توسيع نطاق أعباء العمل الموزعة بشكل أفضل مثل التدريب متعدد الوحدات بشكل أكثر كفاءة من خلال الشبكات عالية السرعة بين مثيلات P4d وبعضها وكذلك بين مثيل P4d وخدمات التخزين مثل Amazon Simple Storage Service‏ (Amazon S3) وFSx for Lustre. EFA هي واجهة شبكة مخصصة صممتها AWS للمساعدة في توسيع نطاق تطبيقات تعلم الآلة (ML) والحوسبة عالية الأداء (HPC) لآلاف وحدات معالجة الرسومات (GPUs). لتقليل زمن الاستجابة بشكل أكبر، يتم دمج EFA مع NVIDIA GPUDirect RDMA لتمكين اتصال من GPU إلى GPU بزمن انتقال منخفض بين الخوادم مع تجاوز نظام التشغيل.

يمكنك الوصول إلى وحدات تخزين عالية الإنتاجية وزمن انتقال منخفض على نطاق بيتابايت باستخدام FSx for Lustre أو وحدات تخزين غير محدودة تقريبًا وفعالة من حيث التكلفة مع Amazon S3 بسرعات 400 جيجابت في الثانية. بالنسبة لأحمال العمل التي تحتاج إلى وصول سريع إلى مجموعات البيانات الكبيرة، يشتمل كل مثيل P4d أيضًا على وحدة تخزين SSD تستند إلى NVME بسعة 8 تيرابايت مع سرعة قراءة 16 جيجابايت/ثانية.

صُممت مثيلات P4d على AWS Nitro System هو مجموعة غنية من كتل الإنشاء التي تفرغ عديدًا من الوظائف الافتراضية التقليدية في الأجهزة والبرامج المخصصة لتقديم أداءٍ عالٍ وتوفر بدرجة كبيرة وأمان عالٍ بينما تعمل كذلك على خفض النفقات الافتراضية.

شهادات العملاء

في ما يلي بعض الأمثلة عن كيفية تحقيق العملاء والشركاء لأهداف أعمالهم باستخدام مثيلات Amazon EC2 P4.

  • Toyota Research Institute (TRI)

    يعمل معهد تويوتا للأبحاث (TRI)، الذي تأسس في عام 2015، على تطوير القيادة الآلية والروبوتات وغيرها من تقنيات التضخيم البشري لتويوتا.

    في TRI، نعمل على بناء مستقبل يتمتع فيه الجميع بحرية التنقل. لقد ساعدتنا مثيلات P3 من الجيل السابق على تقليل الوقت اللازم لتدريب نماذج تعلم الآلة (ML) من أيام إلى ساعات، ونتطلع إلى استخدام مثيلات P4d، حيث ستسمح ذاكرة GPU الإضافية وتنسيقات الطفو الأكثر كفاءة لفريق تعلم الآلة لدينا بالتدريب على نماذج أكثر تعقيدًا بسرعة أكبر.

    Mike Garrison، القائد الفني، هندسة البنية التحتية (Technical Lead, Infrastructure Engineering)، TRI
  • TRI-AD

    في TRI-AD، نعمل على بناء مستقبل يتمتع فيه الجميع بحرية التحرك والاستكشاف مع التركيز على الحد من إصابات المركبات والوفيات باستخدام القيادة التكيفية والمدينة الذكية. من خلال استخدام مثيلات Amazon EC2 P4d، تمكنا من تقليل وقت التدريب للتعرف على الأشياء بنسبة 40% مقارنة بمثيلات GPU من الجيل السابق دون أي تعديل على الرموز الحالية.

    Junya Inada، مديرة القيادة الآلية (Director of Automated Driving (Recognition))، TRI-AD
  • TRI-AD

    من خلال استخدام مثيلات Amazon EC2 P4d، تمكنا من تقليل تكلفة التدريب على الفور مقارنة بمثيلات GPU من الجيل السابق، مما مكننا من زيادة عدد الفرق التي تعمل على تدريب النموذج. سمحت لنا تحسينات الشبكات في P4d بالتوسع بكفاءة إلى عشرات المثيلات، مما أعطانا سرعة كبيرة لتحسين النماذج وإعادة تدريبها ونشرها بسرعة في سيارات الاختبار أو بيئات المحاكاة لمزيد من الاختبارات.

    Jack Yan، المدير الأول لهندسة البنية التحتية (Senior Director of Infrastructure Engineering)، TRI-AD
  • GE Healthcare

    GE Healthcare هي شركة عالمية رائدة في مجال التكنولوجيا الطبية والحلول الرقمية المبتكرة. تمكّن GE Healthcare الأطباء من اتخاذ قرارات أسرع وأكثر استنارة من خلال الأجهزة الذكية وتحليلات البيانات والتطبيقات والخدمات، بدعم من منصة Edison للذكاء.

    في GE Healthcare، نوفر للأطباء الأدوات التي تساعدهم على تجميع البيانات وتطبيق الذكاء الاصطناعي (AI) والتحليلات على تلك البيانات والكشف عن الأفكار التي تعمل على تحسين نتائج المرضى وزيادة الكفاءة والقضاء على الأخطاء. تنتج أجهزة التصوير الطبي لدينا كميات هائلة من البيانات التي تحتاج إلى معالجتها من قبل علماء البيانات لدينا. مع مجموعات GPU السابقة، سيستغرق الأمر أيامًا لتدريب نماذج الذكاء الاصطناعي المعقدة (AI)، مثل شبكات GAN التقدمية، لعمليات المحاكاة وعرض النتائج. أدى استخدام مثيلات P4d الجديدة إلى تقليل وقت المعالجة من أيام إلى ساعات. لقد رأينا سرعة أكبر بمرتين إلى ثلاث مرات في نماذج التدريب ذات أحجام الصور المختلفة، مع تحقيق أداء أفضل مع زيادة حجم الدفعة وإنتاجية أعلى مع دورة تطوير نموذج أسرع.

    Karley Yoder، نائب الرئيس والمدير العام للذكاء الاصطناعي (VP & GM, Artificial Intelligence)، GM Healthcare
  • HEAVY.AI

    HEAVY.AI هي شركة رائدة في التحليلات المتسارعة. تُستخدم منصة HEAVY.AI في الأعمال التجارية والحكومة للعثور على رؤى في البيانات تتجاوز حدود أدوات التحليلات السائدة.

    في HEAVY.AI، نعمل على بناء مستقبل تتقارب فيه علوم البيانات والتحليلات لتفكيك مجموعة البيانات المنعزلة ودمجها. يستفيد العملاء من كميات هائلة من البيانات التي قد تشمل الموقع والوقت لبناء صورة كاملة ليس فقط لما يحدث، ولكن متى وأين من خلال التصور الدقيق للبيانات الزمنية المكانية. تتيح تقنيتنا رؤية كل من الغابة والأشجار. من خلال استخدام مثيلات Amazon EC2 P4d، تمكنا من تقليل تكلفة نشر منصتنا بشكل كبير مقارنة بمثيلات GPU من الجيل السابق، مما مكننا من توسيع نطاق مجموعات البيانات الضخمة بشكل فعال من حيث التكلفة. أدت تحسينات الشبكات على A100 إلى زيادة كفاءتنا في كيفية التوسع إلى مليارات صفوف البيانات وتمكين عملائنا من الحصول على رؤى بشكل أسرع.

    Ray Falcione، نائب رئيس القطاع العام الأمريكي (VP of US Public Sector)، HEAVY.AI
  • Zenotech Ltd.

    تعيد Zenotech Ltd. تعريف الهندسة عبر الإنترنت من خلال استخدام سحابات HPC Clouds التي تقدم نماذج الترخيص عند الطلب ومزايا الأداء الفائق من خلال الاستفادة من وحدات معالجة الرسومات (GPUs).

    في Zenotech، نقوم بتطوير الأدوات لتمكين المصممين من إنشاء منتجات أكثر كفاءة وصديقة للبيئة. نحن نعمل عبر الصناعات، وتوفر أدواتنا رؤية أفضل لأداء المنتج من خلال استخدام المحاكاة واسعة النطاق. يتيح لنا استخدام مثيلات AWS P4d تشغيل عمليات المحاكاة الخاصة بنا بمعدل 3.5 مرة بشكل أسرع مقارنة بالجيل السابق من وحدات معالجة الرسومات (GPUs). يقلل هذا التسريع من وقتنا لحل المشكلة بشكل كبير، مما يسمح لعملائنا بالحصول على تصميمات في السوق بشكل أسرع أو إجراء عمليات محاكاة بدقة أعلى مما كان ممكنًا في السابق.

    Jamil Appa، المدير والمؤسس المشارك (Director and Cofounder) لشركة Zenotech
  • Aon

    Aon هي شركة خدمات مهنية عالمية رائدة تقدم مجموعة واسعة من حلول المخاطر والتقاعد والصحة. Aon PathWise هو حل لإدارة مخاطر الحوسبة عالية الأداء (HPC) وهو قائم على وحدة معالجة الرسومات (GPU) وقابل للتطوير يمكن لشركات التأمين وشركات إعادة التأمين والبنوك وصناديق التقاعد استخدامه لمواجهة التحديات الرئيسية اليوم مثل اختبار استراتيجية التحوط والتنبؤ التنظيمي والاقتصادي والميزانية. 

    في PathWise Solutions Group LLC، يتيح منتجنا لشركات التأمين وشركات إعادة التأمين وصناديق التقاعد الوصول إلى تكنولوجيا الجيل التالي لحل تحديات التأمين الرئيسية اليوم بسرعة، مثل تعلم الآلة، واختبار استراتيجية التحوط، وإعداد التقارير التنظيمية والمالية، وتخطيط الأعمال والتنبؤ الاقتصادي، وتطوير المنتجات الجديدة والتسعير. من خلال استخدام مثيلات Amazon EC2 P4d، يمكننا تقديم تحسينات مذهلة في السرعة للحسابات أحادية الدقة ومزدوجة الدقة مقارنة بمثيلات GPU من الجيل السابق لإجراء العمليات الحسابية الأكثر تطلبًا، مما يسمح للعملاء بإجراء مجموعة جديدة من العمليات الحسابية والتنبؤ لأول مرة. السرعة مهمة، ونحن نواصل تقديم قيمة ذات مغزى وأحدث التقنيات لعملائنا بفضل المثيلات الجديدة من AWS.

    Van Beach، الرئيس العالمي لحلول الحياة (Global Head of Life Solutions) في مجموعة Aon Pathwise Strategy and Technology Group
  • Rad AI

    تقوم شركة Rad AI، التي تضم خبراء الأشعة والذكاء الاصطناعي، ببناء منتجات تزيد من إنتاجية أخصائي الأشعة، مما يجعل الرعاية الصحية متاحة على نطاق أوسع ويحسن نتائج المرضى. اقرأ دراسة الحالة للتعرُّف على المزيد

    في Rad AI، تتمثل مهمتنا في زيادة الوصول إلى الرعاية الصحية وجودتها للجميع. مع التركيز على سير عمل التصوير الطبي، يوفر Rad AI وقت أخصائيي الأشعة ويقلل من الإرهاق ويعزز الدقة. نحن نستخدم الذكاء الاصطناعي لأتمتة سير عمل الأشعة والمساعدة في تبسيط تقارير الأشعة. مع مثيلات EC2 P4d الجديدة، رأينا استدلالًا أسرع وقدرة على تدريب النماذج بسرعة 2.4 مرة، مع دقة أعلى من مثيلات P3 من الجيل السابق. يتيح ذلك تشخيصًا أسرع وأكثر دقة ووصول أكبر إلى خدمات الأشعة عالية الجودة التي يقدمها عملاؤنا في جميع أنحاء الولايات المتحدة.

    Doktor Gurson، المؤسس المشارك (Cofounder) لشركة Rad AI

تفاصيل المنتج

حجم المثيل وحدات المعالجة المركزية الافتراضية (vCPU) الذاكرة الفورية (جيبي بايت) وحدة معالجة الرسومات (GPU) — A100 ذاكرة وحدة معالجة الرسومات (GPU) النطاق الترددي للشبكة (جيجابت في الثانية) GPUDirect RDMA وحدة معالجة الرسوم من نظير إلى نظير سعة تخزين المثيل (جيجابايت) عرض نطاق EBS (جيجابت في الثانية) السعر حسب الطلب/ساعة مثيل محجوز لمدة 1 سنوات فعال بالساعة* مثيل محجوز لمدة 3 سنوات فعال بالساعة*
p4d.24xlarge 96 1152 8 320 جيجابايت
HBM2
400 ENA وEFA نعم 600 جيجابايت في الثانية NVSwitch 8 × 1000 NVMe SSD 19 USD 32.77 USD 19.22 USD 11.57
p4de.24xlarge (معاينة) 96 1152 8 640 جيجابايت
HBM2e
400 ENA وEFA نعم 600 جيجابايت في الثانية NVSwitch 8 × 1000 NVMe SSD 19 USD 40.96 USD 24.01 USD 14.46
* الأسعار المعروضة تخص Linux/Unix في منطقة AWS بشرق الولايات المتحدة (فيرجينيا الشمالية) وتم تقريبها إلى أقرب سنت. للاطلاع على تفاصيل التسعير الكاملة، راجع تسعير Amazon EC2.

تتوفر مثيلات p4d في مناطق شرق الولايات المتحدة (شمال فيرجينيا وأوهايو) وغرب الولايات المتحدة (أوريجون) وآسيا والمحيط الهادئ (سيول وطوكيو) وأوروبا (فرانكفورت وأيرلندا). تتوفر مثيلات P4de في مناطق شرق الولايات المتحدة (شمال فيرجينيا) وغرب الولايات المتحدة (أوريجون).

يمكن للعملاء شراء مثيلات P4d وP4de كمثيلات حسب الطلب أو مثيلات محجوزة أو مثيلات Spot أو مضيفين مخصصين أو كجزء من خطة التوفير.

ابدأ استخدام مثيلات P4d لتعلم الآلة (ML)

Amazon SageMaker هو خدمة مُدارة بالكامل لبناء نماذج تعلم الآلة وتدريبها وتوزيعها. عند استخدامها مع مثيلات P4d، يستطيع العملاء التكيف بسهولة مع العشرات أو المئات أو الآلاف من وحدات معالجة الرسوم لتدريب نموذج بسرعة على أي نطاق دون القلق من إعداد قطاعات ومسارات للبيانات.

DLAMI توفر لممارسي تعلم الآلة والباحثين البنية التحتية والأدوات لتسريع التعليم العميق في السحابة، على أي نطاق. حاويات التعلم العميق هي صور Docker مثبتة سابقًا باستخدام أُطر عمل التعليم العميق لتسهيل نشر بيئات تعلم الآلة المخصصة من خلال السماح لك بتخطي العملية المعقدة لبناء بيئاتك وتحسينها من البداية.

إذا كنت تفضل إدارة أعباء العمل المعتمدة على الحاويات من خلال خدمات تكوين الحاويات وتنسيقها وإدارتها المؤتمتة، فيمكنك نشر مثيلات P4d باستخدام Amazon EKS أو Amazon ECS.

بدء استخدام مثيلات P4d للحوسبة عالية الأداء (HPC)

تعد مثيلات P4d مثالية لتشغيل عمليات المحاكاة الهندسية، والتمويل الحسابي، وتحليل الزلازل، والنمذجة الجزيئية، وعلم الجينوم، والعرض، وأعباء عمل الحوسبة عالية الأداء (HPC) الأخرى القائمة على وحدة معالجة الرسومات (GPU). في أغلب الأحيان تتطلب تطبيقات الحوسبة عالية الأداء أداءً شبكيًا عاليًا وتخزينًا سريعًا وكميات كبيرة من الذاكرة وإمكانات حوسبة عالية أو تتطلبها كلها معًا. تدعم مثيلات P4d شبكة EFA التي تمكّن تطبيقات الحوسبة عالية الأداء (HPC) باستخدام واجهة تمرير الرسائل (MPI) للتوسع إلى الآلاف من وحدات معالجة الرسومات (GPUs). تساعد AWS Batch وAWS ParallelCluster مطوري الحوسبة عالية الأداء على إنشاء تطبيقات الحوسبة عالية الأداء الموزعة وتوسيع نطاقها بسرعة.

تعرّف على المزيد