Опис
Глибоке навчання
- A30 використовує новаторські функції для оптимізації робочих навантажень. Він прискорює повний діапазон точності, від FP64 до TF32 і INT4. Підтримуючи до чотирьох MIG на GPY, A30 дозволяє одночасно працювати декільком мережам у захищених апаратних розділах із гарантованою якістю обслуговування (QoS). Підтримка структурної розрідженості забезпечує до 2 разів більшу продуктивність на додаток до інших переваг A30 у продуктивності висновків. Провідна на ринку продуктивність штучного інтелекту NVIDIA була продемонстрована в MLPerf Inference. У поєднанні з NVIDIA Triton Inference Server, який легко розгортає штучний інтелект у великих масштабах, A30 приносить цю новаторську продуктивність кожному підприємству.
Високопродуктивні обчислення
- NVIDIA A30 оснащено тензорними ядрами FP64 NVIDIA Ampere, які забезпечують найбільший стрибок у продуктивності HPC з моменту появи графічних процесорів. У поєднанні з 24 гігабайтами (ГБ) пам’яті графічного процесора з пропускною здатністю 933 гігабайти на секунду (ГБ/с) дослідники можуть швидко виконувати обчислення подвійної точності. HPC-додатки також можуть використовувати TF32 для досягнення вищих результатів для операцій множення щільної матриці одинарної точності. Поєднання тензорних ядер FP64 і MIG дає змогу науково-дослідним установам безпечно розділяти графічний процесор, щоб надати багатьом дослідникам доступ до обчислювальних ресурсів із гарантованою якістю обслуговування та максимальним використанням графічного процесора. Підприємства, які розгортають штучний інтелект, можуть використовувати можливості висновків A30 у періоди пікового попиту, а потім перепрофілювати ті самі обчислювальні сервери для робочих навантажень HPC і навчання штучного інтелекту в періоди непікової навантаження.
Високопродуктивний аналіз даних
Фахівці з даних повинні вміти аналізувати, візуалізувати та перетворювати масивні набори даних на ідеї. Але масштабовані рішення часто заплутані наборами даних, розкиданими по кількох серверах. Прискорені сервери з A30 забезпечують необхідну обчислювальну потужність разом із великою пам’яттю HBM2, пропускною здатністю пам’яті 933 ГБ/с і масштабованістю за допомогою NVLink – для вирішення цих робочих навантажень. У поєднанні з NVIDIA InfiniBand, NVIDIA Magnum IO та сайтом бібліотек з відкритим кодом RAPIDS, включаючи прискорювач RAPIDS для Apache Spark, платформа центру обробки даних NVIDIA прискорює ці величезні робочі навантаження з безпрецедентним рівнем продуктивності та ефективності.
Готове рішення для використання
- A30 з MIG максимізує використання інфраструктури прискорення GPU. За допомогою MIG графічний процесор A30 можна розділити на чотири незалежні екземпляри, надаючи багатьом користувачам доступ до прискорення GPU. MIG працює з Kubernetes, контейнерами та віртуалізацією сервера на основі гіпервізора. MIG дозволяє менеджерам інфраструктури пропонувати GPU потрібного розміру з гарантованим QoS для кожної роботи, розширюючи охоплення прискорених обчислювальних ресурсів для кожного користувача.
Підтримка програмного забезпечення vGPU
NVIDIA Virtual PC (vPC)
Віртуальні програми NVIDIA (vApps)
Віртуальна робоча станція NVIDIA RTX (vWS)
NVIDIA Virtual Compute Server (vCS)
Профілі vGPU від 1 ГБ до 24 ГБ
Характеристики