Google запускает Ironwood TPU с 9 216-чиповыми капсулами и жидкостным охлаждением

Alex

Модератор
Команда форума
Местный
Регистрация
13.10.2025
Сообщения
516
Google выпускает Ironwood, свое седьмое поколение Tensor Processing Unit, специализированный ускоритель искусственного интеллекта (AI), который компания называет своим самым продвинутым на сегодняшний день — созданным для эффективного, массового применения и готовым потеснить Нвидию, по мере расширения доступности в ближайшие недели.
1762451531904.png


TPU Ironwood от Google нацелен на территорию Nvidia с мощностью FP8 на уровне подов​

Google анонсировала Ironwood на Google Cloud Next ’25 в апреле и теперь расширяет доступ, позиционируя чип как настраиваемый кремний, адаптированный для «эпохи вывода», когда от моделей ожидается отклик, рассуждение и создание в реальном времени по всей глобальной облачной инфраструктуре.

Согласно отчету CNBC, этот шаг является частью более широкой стратегии среди гипермасштабных компаний, стремящихся владеть AI-комплектом от дата-центра до инструментов разработчиков. Под капотом Ironwood полагается на 3D торусной интерконнект, жидкостное охлаждение для устойчивых нагрузок и улучшенный Sparsecore для ускорения очень больших вложений для ранжирования, рекомендаций, финансов и научных вычислений.

Он спроектирован для минимизации перемещения данных и узких мест коммуникации — двух факторов, которые часто ограничивают пропускную способность в многочиповых задачах. Голые цифры рассчитаны на привлечение внимания: до 4,614 TFLOPs (FP8) на чип, 192 ГБ HBM с пропускной способностью 7,37 ТБ/с и двунаправленной пропускной способностью межчиповой связи 1,2 ТБ/с. Поды масштабируются от 256 чипов до конфигурации из 9,216 чипов с производительностью 42,5 эксафлопс (FP8), с полным потреблением мощностью пода около 10 МВт и жидкостным охлаждением, что позволяет значительное повышение устойчивой производительности по сравнению с воздушным.

Google заявляет, что Ironwood более чем в 4 раза быстрее, чем предыдущий Trillium (TPU v6) в общей производительности AI и предлагает примерно в 2 раза лучшую производительность на ватт — при этом обеспечивая почти в 30 раз более высокую энергетическую эффективность по сравнению с первым Cloud TPU от 2018 года. В максимальной форме компания утверждает, что она превосходит по вычислительной мощности суперкомпьютеры, такие как El Capitan, при измерении в FP8 эксафлопсах. Как всегда, методология имеет значение, но намерения ясны.

Хотя он может обучать, основное использование Ironwood сосредоточено на выведении для больших языковых моделей и систем смешанных экспертов — именно та работа с высоким QPS и низкой задержкой, которая сейчас заполняет дата-центры в Северной Америке, Европе и Азиатско-Тихоокеанском регионе. Подумайте о чат-ботах, агентах, моделях класса Gemini и каналах поиска и рекомендаций с высокими размерами, которые требуют быстрой памяти и тесной синхронизации на уровне подов.

Интеграция осуществляется через AI Hypercomputer от Google Cloud — сочетание аппаратного обеспечения с программным обеспечением, таким как Pathways, для оркестрации распределенных вычислений через тысячи матриц. Этот стек уже поддерживает потребительские и корпоративные сервисы от Поиска до Gmail, и Ironwood встает в качестве пути обновления для клиентов, желающих получить управляемый, родной для TPU маршрут наряду с GPU.

Есть рыночное послание: Google бросает вызов доминированию Nvidia, утверждая, что специализированные TPU могут превзойти универсальные GPU по соотношению цена-производительность и энергопотребление для определенных задач ИИ. В отчете CNBC говорится, что ранние пользователи включают Anthropic, которая планирует развертывание в масштабе миллиона TPU для Claude — вызывающий удивление сигнал того, как велики становятся размеры вывода.

Генеральный директор Alphabet Сундар Пичаи назвал спрос ключевым фактором доходов, упомянув 34% увеличение доходов Google Cloud до 15,15 миллиарда долларов в 3 квартале 2025 года и капитальные затраты, связанные с созданием AI, в размере 93 миллиарда долларов. «Мы видим значительный спрос на наши продукты AI-инфраструктуры… и мы инвестируем, чтобы удовлетворить его», — сказал он, отметив, что в этом году было подписано больше сделок на сумму в миллиард долларов, чем за предыдущие два года вместе взятые.

Широкая доступность Ironwood намечена на конец 2025 года через Google Cloud, с открытыми запросами на доступ уже сейчас. Для предприятий в США, Европе и Азиатско-Тихоокеанском регионе, которые учитывают бюджеты на мощность, плотность стоек и цели по задержке, вопрос стоит не столько о шумихе, сколько о том, соответствуют ли уровень FP8 на уровне подов и профиль охлаждения Ironwood их производственным рабочим нагрузкам.
 
  • Like
Реакции: tim
Назад
Верх