Архитектура Nvidia Ampere

2 min readOct 23, 2020

Для дата-центров, которым важна производительность.

Искусственный интеллект и высокопроизводительные вычисления — вот те задачи, которые необходимо решать современным исследователям и инженерам. Это цель повышенной сложности, а значит, необходим мощный компьютер, который будет справляться с серьезными нагрузками.

NVIDIA Ampere — семинанометровый чип.

ТОП-5 главных причин, почему именно он должен отвечать за масштабируемое ускорение и эластичные вычисления в современных дата-центрах.

Тензорные ядра третьего поколения

Тензорные ядра — это уникальная технология, которая доступна только в NVIDIA Volta™. Они необходимы для ускорения и упрощения работы с ИИ. Ускоренный интерфейс сокращает срок обучения модели новым алгоритмам до нескольких часов. Архитектура поддерживает операции Tensor Float (TF32) и (FP64). С ее помощью можно ускорить интерфейс в 10 раз, при этом не изменяя код.

Multi-Instance GPU (MIG)

Задачи для ИИ и HPC требуют ускоренной работы графического процессора, но не всегда его ресурс должен потребляться на 100%. MIG разделяет A100 на семь объектов, каждый из которых изолирован под индивидуальные задачи. Все объекты защищены, имеют собственную встроенную память, кэш, ядра для проведения вычислений с высокой пропускной способностью.

Что это дает: сохранение ресурсоемкости процессора и эффективное использование его мощностей. Теперь еще больше людей смогут работать на одном сервере, а каждая задача будет потреблять ровно столько мощностей, сколько ей требуется.

NVLink третьего поколения

Скорость передачи данных с NVLink нового поколения возрастает до 600 Гбит/с — а это в десять раз больше, чем у ближайших конкурентов.

Все задачи выполняются в рекордно короткие сроки.

Структурная разреженность

Для современных моделей ИИ характерен большой объем параметров. Для их обслуживания, а также для прогнозирования интерфейсов нужны разреженные модели. Они помогают избегать ошибки в вычислениях. Tensor Cores in A100 созданы специально для разреженных моделей, так как обеспечивают для них рекордную производительность. Точность выполнения задач также повлияет и на скорость: тренировка модели теперь занимает всего несколько часов.

Улучшенная память

Новая архитектура NVIDIA Ampere обеспечивает большой объем памяти, для того, чтобы осуществлять вычисления в дата-центре с высокой пропускной способностью в 1,5 Тб/с. Это на 67% быстрее, чем у конкурентов. Кроме того, присутствует кэш второго уровня на 40 Мб, что в 7 раз больше, чем у второго поколения.