Nvidia представила акселератор A100 PCIe с 80 Гбайт памяти HBM2E |
28.06.2021 14:00
Компания Nvidia официально анонсировала новый ускоритель A100, выполненный в виде карты расширения с интерфейсом PCIe. Изделие предназначено для решения сложных вычислительных задач.
Акселератор, выполненный на архитектуре Nvidia Ampere, содержит тензорные ядра. Решение, как утверждается, обладает самой большой в мире пропускной способностью памяти - более 2 Тбайт/с. Это позволяет работать с крупными моделями и обширными наборами данных.
Пиковая производительность в режиме FP64 (операции с плавающей запятой двойной точности) достигает 9,7 терафлопса. В режиме FP32 данный показатель составляет 19,5 терафлопса.
Новинка получила 80 Гбайт памяти HBM2E. Это вдвое больше по сравнению с ранее доступной моделью, которая укомплектована 40 Гбайт памяти.
"Тензорные ядра в Nvidia A100 с поддержкой Tensor Float (TF32) повышают производительность в 20 раз по сравнению с Nvidia Volta, не требуя изменений в коде, и в два раза ускоряют автоматическую функцию работы с различной точностью и FP16. При объединении с Nvidia NVLink, Nvidia NVSwitch, PCI Gen4, Nvidia Mellanox InfiniBand ускоритель A100 можно масштабировать в тысячи раз", - отмечает производитель.
Максимальное значение рассеиваемой тепловой энергии (величина TDP) карты составляет 250 Вт. Графический чип изготавливается на предприятии TSMC с применением 7-нанометровой технологии. Задействован интерфейс PCI Express 4.0.
Ускоритель подходит для решения задач, связанных с алгоритмами искусственного интеллекта, глубокого машинного обучения и пр. Акселератор позволяет получать результаты в реальном времени и разворачивать масштабируемые решения.
Источник: DailyComm
Акселератор, выполненный на архитектуре Nvidia Ampere, содержит тензорные ядра. Решение, как утверждается, обладает самой большой в мире пропускной способностью памяти - более 2 Тбайт/с. Это позволяет работать с крупными моделями и обширными наборами данных.
Пиковая производительность в режиме FP64 (операции с плавающей запятой двойной точности) достигает 9,7 терафлопса. В режиме FP32 данный показатель составляет 19,5 терафлопса.
Новинка получила 80 Гбайт памяти HBM2E. Это вдвое больше по сравнению с ранее доступной моделью, которая укомплектована 40 Гбайт памяти.
"Тензорные ядра в Nvidia A100 с поддержкой Tensor Float (TF32) повышают производительность в 20 раз по сравнению с Nvidia Volta, не требуя изменений в коде, и в два раза ускоряют автоматическую функцию работы с различной точностью и FP16. При объединении с Nvidia NVLink, Nvidia NVSwitch, PCI Gen4, Nvidia Mellanox InfiniBand ускоритель A100 можно масштабировать в тысячи раз", - отмечает производитель.
Максимальное значение рассеиваемой тепловой энергии (величина TDP) карты составляет 250 Вт. Графический чип изготавливается на предприятии TSMC с применением 7-нанометровой технологии. Задействован интерфейс PCI Express 4.0.
Ускоритель подходит для решения задач, связанных с алгоритмами искусственного интеллекта, глубокого машинного обучения и пр. Акселератор позволяет получать результаты в реальном времени и разворачивать масштабируемые решения.
Источник: DailyComm
-
30.03.2022
-
15.03.2022
-
14.03.2022
-
11.03.2022
-
10.03.2022
-
10.03.2022
-
22.02.2022
-
21.02.2022
-
21.02.2022
-
16.02.2022
-
15.02.2022
-
14.02.2022
-
11.02.2022
-
11.02.2022
-
09.02.2022