Архитектура Nvidia Ampere
Для дата-центров, которым важна производительность.
Искусственный интеллект и высокопроизводительные вычисления — вот те задачи, которые необходимо решать современным исследователям и инженерам. Это цель повышенной сложности, а значит, необходим мощный компьютер, который будет справляться с серьезными нагрузками.
NVIDIA Ampere — семинанометровый чип.
ТОП-5 главных причин, почему именно он должен отвечать за масштабируемое ускорение и эластичные вычисления в современных дата-центрах.
Тензорные ядра третьего поколения
Тензорные ядра — это уникальная технология, которая доступна только в NVIDIA Volta™. Они необходимы для ускорения и упрощения работы с ИИ. Ускоренный интерфейс сокращает срок обучения модели новым алгоритмам до нескольких часов. Архитектура поддерживает операции Tensor Float (TF32) и (FP64). С ее помощью можно ускорить интерфейс в 10 раз, при этом не изменяя код.
Multi-Instance GPU (MIG)
Задачи для ИИ и HPC требуют ускоренной работы графического процессора, но не всегда его ресурс должен потребляться на 100%. MIG разделяет A100 на семь объектов, каждый из которых изолирован под индивидуальные задачи. Все объекты защищены, имеют собственную встроенную память, кэш, ядра для проведения вычислений с высокой пропускной способностью.
Что это дает: сохранение ресурсоемкости процессора и эффективное использование его мощностей. Теперь еще больше людей смогут работать на одном сервере, а каждая задача будет потреблять ровно столько мощностей, сколько ей требуется.
NVLink третьего поколения
Скорость передачи данных с NVLink нового поколения возрастает до 600 Гбит/с — а это в десять раз больше, чем у ближайших конкурентов.
Все задачи выполняются в рекордно короткие сроки.
Структурная разреженность
Для современных моделей ИИ характерен большой объем параметров. Для их обслуживания, а также для прогнозирования интерфейсов нужны разреженные модели. Они помогают избегать ошибки в вычислениях. Tensor Cores in A100 созданы специально для разреженных моделей, так как обеспечивают для них рекордную производительность. Точность выполнения задач также повлияет и на скорость: тренировка модели теперь занимает всего несколько часов.
Улучшенная память
Новая архитектура NVIDIA Ampere обеспечивает большой объем памяти, для того, чтобы осуществлять вычисления в дата-центре с высокой пропускной способностью в 1,5 Тб/с. Это на 67% быстрее, чем у конкурентов. Кроме того, присутствует кэш второго уровня на 40 Мб, что в 7 раз больше, чем у второго поколения.