- Регистрация
- 13.10.2025
- Сообщения
- 516
Google выпускает Ironwood, свое седьмое поколение Tensor Processing Unit, специализированный ускоритель искусственного интеллекта (AI), который компания называет своим самым продвинутым на сегодняшний день — созданным для эффективного, массового применения и готовым потеснить Нвидию, по мере расширения доступности в ближайшие недели.

Согласно отчету CNBC, этот шаг является частью более широкой стратегии среди гипермасштабных компаний, стремящихся владеть AI-комплектом от дата-центра до инструментов разработчиков. Под капотом Ironwood полагается на 3D торусной интерконнект, жидкостное охлаждение для устойчивых нагрузок и улучшенный Sparsecore для ускорения очень больших вложений для ранжирования, рекомендаций, финансов и научных вычислений.
Он спроектирован для минимизации перемещения данных и узких мест коммуникации — двух факторов, которые часто ограничивают пропускную способность в многочиповых задачах. Голые цифры рассчитаны на привлечение внимания: до 4,614 TFLOPs (FP8) на чип, 192 ГБ HBM с пропускной способностью 7,37 ТБ/с и двунаправленной пропускной способностью межчиповой связи 1,2 ТБ/с. Поды масштабируются от 256 чипов до конфигурации из 9,216 чипов с производительностью 42,5 эксафлопс (FP8), с полным потреблением мощностью пода около 10 МВт и жидкостным охлаждением, что позволяет значительное повышение устойчивой производительности по сравнению с воздушным.
Google заявляет, что Ironwood более чем в 4 раза быстрее, чем предыдущий Trillium (TPU v6) в общей производительности AI и предлагает примерно в 2 раза лучшую производительность на ватт — при этом обеспечивая почти в 30 раз более высокую энергетическую эффективность по сравнению с первым Cloud TPU от 2018 года. В максимальной форме компания утверждает, что она превосходит по вычислительной мощности суперкомпьютеры, такие как El Capitan, при измерении в FP8 эксафлопсах. Как всегда, методология имеет значение, но намерения ясны.
Хотя он может обучать, основное использование Ironwood сосредоточено на выведении для больших языковых моделей и систем смешанных экспертов — именно та работа с высоким QPS и низкой задержкой, которая сейчас заполняет дата-центры в Северной Америке, Европе и Азиатско-Тихоокеанском регионе. Подумайте о чат-ботах, агентах, моделях класса Gemini и каналах поиска и рекомендаций с высокими размерами, которые требуют быстрой памяти и тесной синхронизации на уровне подов.
Интеграция осуществляется через AI Hypercomputer от Google Cloud — сочетание аппаратного обеспечения с программным обеспечением, таким как Pathways, для оркестрации распределенных вычислений через тысячи матриц. Этот стек уже поддерживает потребительские и корпоративные сервисы от Поиска до Gmail, и Ironwood встает в качестве пути обновления для клиентов, желающих получить управляемый, родной для TPU маршрут наряду с GPU.
Есть рыночное послание: Google бросает вызов доминированию Nvidia, утверждая, что специализированные TPU могут превзойти универсальные GPU по соотношению цена-производительность и энергопотребление для определенных задач ИИ. В отчете CNBC говорится, что ранние пользователи включают Anthropic, которая планирует развертывание в масштабе миллиона TPU для Claude — вызывающий удивление сигнал того, как велики становятся размеры вывода.
Генеральный директор Alphabet Сундар Пичаи назвал спрос ключевым фактором доходов, упомянув 34% увеличение доходов Google Cloud до 15,15 миллиарда долларов в 3 квартале 2025 года и капитальные затраты, связанные с созданием AI, в размере 93 миллиарда долларов. «Мы видим значительный спрос на наши продукты AI-инфраструктуры… и мы инвестируем, чтобы удовлетворить его», — сказал он, отметив, что в этом году было подписано больше сделок на сумму в миллиард долларов, чем за предыдущие два года вместе взятые.
Широкая доступность Ironwood намечена на конец 2025 года через Google Cloud, с открытыми запросами на доступ уже сейчас. Для предприятий в США, Европе и Азиатско-Тихоокеанском регионе, которые учитывают бюджеты на мощность, плотность стоек и цели по задержке, вопрос стоит не столько о шумихе, сколько о том, соответствуют ли уровень FP8 на уровне подов и профиль охлаждения Ironwood их производственным рабочим нагрузкам.

TPU Ironwood от Google нацелен на территорию Nvidia с мощностью FP8 на уровне подов
Google анонсировала Ironwood на Google Cloud Next ’25 в апреле и теперь расширяет доступ, позиционируя чип как настраиваемый кремний, адаптированный для «эпохи вывода», когда от моделей ожидается отклик, рассуждение и создание в реальном времени по всей глобальной облачной инфраструктуре.Согласно отчету CNBC, этот шаг является частью более широкой стратегии среди гипермасштабных компаний, стремящихся владеть AI-комплектом от дата-центра до инструментов разработчиков. Под капотом Ironwood полагается на 3D торусной интерконнект, жидкостное охлаждение для устойчивых нагрузок и улучшенный Sparsecore для ускорения очень больших вложений для ранжирования, рекомендаций, финансов и научных вычислений.
Он спроектирован для минимизации перемещения данных и узких мест коммуникации — двух факторов, которые часто ограничивают пропускную способность в многочиповых задачах. Голые цифры рассчитаны на привлечение внимания: до 4,614 TFLOPs (FP8) на чип, 192 ГБ HBM с пропускной способностью 7,37 ТБ/с и двунаправленной пропускной способностью межчиповой связи 1,2 ТБ/с. Поды масштабируются от 256 чипов до конфигурации из 9,216 чипов с производительностью 42,5 эксафлопс (FP8), с полным потреблением мощностью пода около 10 МВт и жидкостным охлаждением, что позволяет значительное повышение устойчивой производительности по сравнению с воздушным.
Google заявляет, что Ironwood более чем в 4 раза быстрее, чем предыдущий Trillium (TPU v6) в общей производительности AI и предлагает примерно в 2 раза лучшую производительность на ватт — при этом обеспечивая почти в 30 раз более высокую энергетическую эффективность по сравнению с первым Cloud TPU от 2018 года. В максимальной форме компания утверждает, что она превосходит по вычислительной мощности суперкомпьютеры, такие как El Capitan, при измерении в FP8 эксафлопсах. Как всегда, методология имеет значение, но намерения ясны.
Хотя он может обучать, основное использование Ironwood сосредоточено на выведении для больших языковых моделей и систем смешанных экспертов — именно та работа с высоким QPS и низкой задержкой, которая сейчас заполняет дата-центры в Северной Америке, Европе и Азиатско-Тихоокеанском регионе. Подумайте о чат-ботах, агентах, моделях класса Gemini и каналах поиска и рекомендаций с высокими размерами, которые требуют быстрой памяти и тесной синхронизации на уровне подов.
Интеграция осуществляется через AI Hypercomputer от Google Cloud — сочетание аппаратного обеспечения с программным обеспечением, таким как Pathways, для оркестрации распределенных вычислений через тысячи матриц. Этот стек уже поддерживает потребительские и корпоративные сервисы от Поиска до Gmail, и Ironwood встает в качестве пути обновления для клиентов, желающих получить управляемый, родной для TPU маршрут наряду с GPU.
Есть рыночное послание: Google бросает вызов доминированию Nvidia, утверждая, что специализированные TPU могут превзойти универсальные GPU по соотношению цена-производительность и энергопотребление для определенных задач ИИ. В отчете CNBC говорится, что ранние пользователи включают Anthropic, которая планирует развертывание в масштабе миллиона TPU для Claude — вызывающий удивление сигнал того, как велики становятся размеры вывода.
Генеральный директор Alphabet Сундар Пичаи назвал спрос ключевым фактором доходов, упомянув 34% увеличение доходов Google Cloud до 15,15 миллиарда долларов в 3 квартале 2025 года и капитальные затраты, связанные с созданием AI, в размере 93 миллиарда долларов. «Мы видим значительный спрос на наши продукты AI-инфраструктуры… и мы инвестируем, чтобы удовлетворить его», — сказал он, отметив, что в этом году было подписано больше сделок на сумму в миллиард долларов, чем за предыдущие два года вместе взятые.
Широкая доступность Ironwood намечена на конец 2025 года через Google Cloud, с открытыми запросами на доступ уже сейчас. Для предприятий в США, Европе и Азиатско-Тихоокеанском регионе, которые учитывают бюджеты на мощность, плотность стоек и цели по задержке, вопрос стоит не столько о шумихе, сколько о том, соответствуют ли уровень FP8 на уровне подов и профиль охлаждения Ironwood их производственным рабочим нагрузкам.