Nvidia Hopper H100: Огромный 4-нм GPU, предназначенный для искусственного интеллекта

Nvidia Hopper H100: Связь с искусственным интеллектом

Для широкой публики компания Nvidia - это прежде всего ведущий производитель чипов для видеокарт, серия GeForce которого уже более десяти лет занимает лидирующие позиции на рынке. Но под руководством генерального директора Дженсена Хуанга компания всегда видела далеко за пределами геймерского рынка и очень быстро позиционировала себя как крупного игрока в области аппаратного ускорения. Область, в которой спрос растет, даже экспоненциально, учитывая огромную потребность в ресурсах в таких областях, как искусственный интеллект и управление моделями (климат, дороги и т.д.).

Два разных подхода

Для этого сектора у Nvidia исторически всегда было два разных подхода. Первый заключался в адаптации своих графических архитектур к двум вариантам, один из которых был потребительским, а другой профессиональным - как в случае с Ampere; второй - в создании двух отдельных архитектур, каждая из которых была нацелена на определенный рынок, как в случае с Volta, которая была разработана специально для сферы ускорения.

Hopper является частью этого второго подхода. Архитектура была разработана для сектора ускорения, чтобы оправдать ожидания в плане ИИ или даже омниверса. И самое меньшее, что мы можем сказать, — это то, что спустя два года после чипа GA100 (архитектура Ampere) Nvidia представила чип H100, который на бумаге выглядит довольно впечатляюще. Этот чип с 80 миллиардами транзисторов, расположенных на площади 814 мм², значительно отличается от своего предшественника, который был "ограничен" 54,2 миллиардами транзисторов на площади 828 мм². Эти цифры совсем не обманчивы, поскольку Nvidia отказалась от 7-нм техпроцесса в пользу 4-нм, предлагаемого TSMC (нода N4). Чип также потребляет максимум 700 Вт, что гораздо больше, чем 500 Вт у предыдущего поколения.

Nvidia Transformer Engine

Оснащение чипа

Чип оснащен интерфейсом PCIe 5.0 и окружен максимум 80 ГБ выделенной памяти HBM3 - этого достаточно, чтобы обеспечить пропускную способность в 3 ТБ/с. Конкретные вычислительные блоки, которые Nvidia называет ускорителями, были пересмотрены, в частности, появилось четвертое поколение Tensor Core, предназначенное для ИИ, которые, как утверждается, в шесть раз быстрее, чем у чипа GA100. Количество ядер CUDA увеличилось с 6912 до 16 896. Это дает сырую производительность в три раза выше, чем у ускорителя предыдущего поколения, всего за два года.

Transformer Engine

Nvidia также разработала новый ускоритель под названием Transformer Engine. Он предназначен для ускорения обработки моделей, связанных с искусственным интеллектом, таких как перевод в реальном времени, интерпретация запросов, анализ изображений и даже исследования в области здравоохранения и климата. Обучение нейронов, которое раньше занимало несколько дней, теперь может быть выполнено всего за несколько часов. Этот факт заинтересует многих, и не в последнюю очередь Google, чей алгоритм BERT использует этот тип движка для лучшего понимания запросов пользователей и предоставления все более точных ответов. В качестве примера Nvidia сообщила, что работа, которая раньше занимала 7 дней на 8 000 GPU, теперь займет всего 20 часов с чипами Hopper.

Новый GPU

Этот новый GPU будет доступен партнерам Nvidia с третьего квартала. Его можно приобрести по отдельности (в формате PCIe) или в виде стоек DGX с 8 модулями или шкафов SuperPOD с 32 модулями. Максимум 256 модулей могут быть соединены между собой с помощью коммутатора NVLink, способного обеспечить связь между модулями со скоростью 70,4 ТБ/с. Наконец, в программу уже включены суперкомпьютеры, в частности, подразделение Nvidia Eos - суперкомпьютер, который компания будет использовать сама и предлагать своим партнерам, — в котором будет размещено 576 стоек DGX, представляющих 4608 GPU. Вычислительная мощность Eos составит 275 петафлопс в FP64, что сделает его вторым по мощности суперкомпьютером в мире после Fugaku (442 петафлопс). Теперь остается только ждать анонсов Nvidia в потребительском секторе: вполне вероятно, что компания объявит о преемнике Ampère в ближайшие месяцы.

Характеристики Nvidia Hopper H100

Ключевые выводы

1. Графический процессор Hopper H100 от Nvidia, представленный на GTC, знаменует собой выход компании на рынок аппаратного ускорения для профессионального сектора, в частности для приложений искусственного интеллекта. Благодаря впечатляющим 80 миллиардам транзисторов, вытравленных по 4-нм техпроцессу, H100 способен удовлетворить растущий спрос на ускоренные вычисления.

2. Исторически Nvidia подходила к аппаратному ускорению с двумя стратегиями: адаптация потребительских графических архитектур для профессионального использования и создание отдельных архитектур, предназначенных для конкретных рынков. Hopper следует последнему подходу и разработан специально для таких секторов ускорения, как искусственный интеллект и омниканальные приложения.

3. Чип H100 может похвастаться значительными улучшениями по сравнению со своими предшественниками. Он содержит 80 миллиардов транзисторов на матрице размером 814 мм², изготовленной по 4-нм техпроцессу TSMC. Благодаря максимальному энергопотреблению 700 Вт и выделенной памяти HBM3 объемом до 80 ГБ чип обеспечивает существенный прирост производительности.

4. В чип встроены тензорные ядра четвертого поколения, предназначенные для работы с искусственным интеллектом и обеспечивающие в шесть раз более высокую производительность по сравнению с предыдущими версиями. Количество ядер CUDA также значительно увеличилось, в результате чего сырьевая производительность выросла в три раза по сравнению с предыдущим поколением "педали газа".

5. Nvidia представляет движок Transformer Engine, предназначенный для ускорения обработки моделей, связанных с ИИ, включая перевод в реальном времени, интерпретацию запросов, анализ изображений и исследования в области здравоохранения и климата. Обучение нейронных сетей, на которое раньше уходили дни, теперь можно проводить за считанные часы.

6. Несмотря на то, что архитектура Hopper нацелена на профессиональный сектор, ожидание анонсов в потребительском секторе по-прежнему велико. С учетом вероятности появления преемника архитектуры Ampère на горизонте, Nvidia продолжает формировать ландшафт ускоренных вычислений.

Review

оставить отзыв