ما سبب أهمية Trainium؟
رقائق AWS Trainium هي مجموعة من رقائق الذكاء الاصطناعي التي صممتها AWS خصيصًا للتدريب والاستدلال على الذكاء الاصطناعي لتقديم أداء عالٍ مع تقليل التكاليف.
تعمل شريحة AWS Trainium من الجيل الأول على تشغيل مثيلات Amazon Elastic Compute Cloud (Amazon EC2) Trn1، التي تقل تكاليف التدريب فيها بنسبة تصل إلى 50% عن مثيلات Amazon EC2 المماثلة. يحقق العديد من العملاء، بما في ذلك Databricks وRicoh وNinjaTech AI وArcee AI، فوائد الأداء والتكلفة لمثيلات Trn1.
توفر شريحة AWS Trainium2 ما يصل إلى 4 أضعاف أداء الجيل الأول من Trainium. صُمِّمَت مثيلات Amazon EC2 Trn2 المستندة إلى Trainium2 خصيصًا للذكاء الاصطناعي المولّد وهي أقوى مثيلات EC2 للتدريب ونشر النماذج التي تحتوي على مئات المليارات إلى أكثر من تريليون من المعلمات. توفر مثيلات Trn2 أداء سعريًا أفضل بنسبة 30-40% من الجيل الحالي من مثيلات EC2 P5e وP5en المستندة إلى وحدة معالجة الرسومات (GPU). تتميز مثيلات Trn2 بـ 16 شريحة Trainium2 مترابطة مع NeuronLink، وهو نظام الربط الخاص بنا من شريحة إلى شريحة. يمكنك استخدام مثيلات Trn2 لتدريب ونشر النماذج الأكثر تطلبًا بما في ذلك نماذج اللغة الكبيرة (LLMs) والنماذج متعددة الوسائط ومحولات الانتشار، لبناء مجموعة واسعة من تطبيقات الذكاء الاصطناعي المُولِّد من الجيل التالي. يعتبر Trn2 UltraServers، وهو عرض EC2 جديد تمامًا (متوفر في المعاينة)، مثاليًا لأكبر النماذج التي تتطلب المزيد من الذاكرة وعرض النطاق الترددي للذاكرة مما يمكن أن توفره مثيلات EC2 المستقلة. UltraServer يستخدم تصميم NeuronLink لتوصيل 64 شريحة Trainium2 عبر أربع مثيلات Trn2 في عقدة واحدة، مما يفتح إمكانات جديدة. للاستدلال، تساعد UltraServers في توفير وقت استجابة رائد في الصناعة لإنشاء أفضل التجارب في الوقت الفعلي. بالنسبة للتدريب، تعمل UltraServers على تعزيز سرعة تدريب النموذج وكفاءته من خلال الاتصال الجماعي الأسرع لتوازي النموذج مقارنة بالحالات المستقلة.
يمكنك بدء التدريب ونشر النماذج على مثيلات Trn2 وTrn1 مع الدعم الأصلي لأطر تعلم الآلة الشائعة (ML) مثل PyTorch وJAX.