AWS Trainium3: новый чип для ИИ с энергоэффективностью

Amazon Web Services представила новое поколение своих чипов для обучения искусственного интеллекта — Trainium3. Это значительный шаг вперед, обещающий существенное увеличение производительности и снижение энергопотребления.

На ежегодной конференции AWS re:Invent 2025 компания официально анонсировала систему Trainium3 UltraServer, основанную на передовом 3-нанометровом чипе Trainium3 и собственной сетевой технологии AWS. По сравнению со вторым поколением, новый чип и система демонстрируют значительный прирост в скорости как обучения моделей ИИ, так и предоставления их результатов.

AWS заявляет, что система стала более чем в 4 раза быстрее и имеет в 4 раза больше памяти. Это касается не только обучения, но и обеспечения пиковой производительности при работе с ИИ-приложениями. Тысячи серверов UltraServer могут быть объединены, предоставляя приложениям доступ к 1 миллиону чипов Trainium3 — это десятикратное увеличение по сравнению с предыдущим поколением. Каждый сервер UltraServer вмещает до 144 чипов.

Важным аспектом является и повышенная энергоэффективность: чипы и системы Trainium3 на 40% экономичнее предыдущего поколения. В то время как мир стремится к созданию все более крупных дата-центров, требующих огромных затрат электроэнергии, AWS фокусируется на разработке систем, потребляющих меньше ресурсов.

Такой подход выгоден самой AWS, но, в духе клиентоориентированности Amazon, компания обещает, что эти системы позволят и ее клиентам в сфере облачных ИИ-сервисов значительно сократить расходы. Среди компаний, уже использующих чип и систему третьего поколения, — Anthropic (которую Amazon также инвестирует), японская LLM Karakuri, SplashMusic и Decart. Они отмечают существенное снижение затрат на инференс.

AWS также приоткрыла завесу над будущим, представив дорожную карту для следующего чипа — Trainium4, который уже находится в разработке. Ожидается, что Trainium4 обеспечит еще один значительный скачок в производительности и получит поддержку технологии высокоскоростного соединения чипов Nvidia NVLink Fusion.

Это означает, что системы на базе AWS Trainium4 смогут взаимодействовать и расширять свою производительность с GPU Nvidia, при этом используя собственную, более экономичную серверную технологию Amazon. Стоит отметить, что CUDA от Nvidia стала де-факто стандартом для большинства крупных ИИ-приложений. Системы с Trainium4 могут упростить привлечение таких приложений, ориентированных на GPU Nvidia, в облако Amazon.

Amazon не назвала точных сроков появления Trainium4. Однако, учитывая предыдущий опыт, можно ожидать более подробной информации на конференции следующего года.

Комментарии

Комментариев пока нет.