Итоги NVIDIA GTC 2020: спецификации ГП Ampere A100, Ray Tracing, DGX-3 и EGX
14.05.2020 232 0 AmpereMan

Итоги NVIDIA GTC 2020: спецификации ГП Ampere A100, Ray Tracing, DGX-3 и EGX

Hardware
В закладки
На мероприятии GTC за последние несколько лет редко показывались новинки игрового сегмента, но там часто презентуют архитектуры, которые в итоге всё же достигают игрового сегмента. Volta является хорошим примером этого, ведь тогда мы не получили игровые карты сразу, но мы увидели, то, что предшествовало Turing. На мероприятии этого года компания продемонстрировала свою новую архитектуру Ampere, уделив особое внимание напоминанию о достижениях в области игр и развитию трассировки лучей, а также подчеркнула цели архитектуры в области искусственного интеллекта, машинного обучения и глубокого обучения. Похоже, что Ampere в какой-то момент перейдет в игровой сегмент, в отличие от Volta и Turing, которые были технически разными архитектурами. 

Мы думали, что NVIDIA будет транслировать предварительно записанное видео, но компания решила, что загрузить несколько отредактированных видео по крайней мере в 8 частей будет лучшей идеей. Приступим к разбору.

RTX и DLSS 2.0

Новостей относительно RTX было лишь несколько. Компания напомнила всем о DLSS и снова продемонстрировала DLSS 2.0. Хуанг признал, что, «большинство людей не думали, что это сработает», добавив, что «первое поколение имело проблемы с четкостью», затем показал для сравнения изображения DLSS 2.0 и заявил, что DLSS 2.0 справился лучше, чем стандартные 1080p.
Что касается продуктов RTX и трассировки лучей, то в основном было еще раз подчеркнуто, что стек продуктов существует и развивается, а также упомянуто, что «сразу после запуска, люди были скептически настроены, но теперь это здесь». Справедливости ради следует отметить, что сразу после запуска карты часто умирали с дефектами в виде артефактов, а в течение примерно 55 дней после запуска карт RTX не было никаких игр с его поддержкой, поэтому люди были по праву скептически настроены. Тем не менее, NVIDIA полностью сместила акцент индустрии на трассировку лучей и сделала это раньше, чем, вероятно, остальная индустрия была готова, в частности AMD. Даже для новых консолей готовят трассировку лучей.

NVIDIA Omniverse

NVIDIA также рассказала о своем решении Omniverse, которое представляет собой RTX-сервер с RTX 8000. Ничто из этого не имеет новой архитектуры графического процессора, но компания продемонстрировала игру с акцентом на физику шаров (похожую на классику, такую как Spectraball). Движение камеры было несколько скучным, но графикабыла в центре внимания. 

NVIDIA Ampere

NVIDIA также выступила со своим очередным анонсом «Самый большой в мире графический процессор», представив NVIDIA Ampere и плату процессора A100. Он создан для использования в центрах обработки данных и предприятиях и не является игровым продуктом, но в конечном итоге наработки этой архитектуры будут использоваться в игровых продуктах. Это также стоит осветить только потому, что это главное достижение в пределах этой категории.
Плата графического процессора A100 весит больше 20 килограммов, на ней размещается 8 графических процессоров, соединённых через новый интерфейс NVLink со скоростью до 600ГБ/с, и 6 переключателей. Некоторые дополнительные интересные факты также были представлены. Например, понадобился 1 километр медных дорожек, соединяющих все оборудование и 1 миллион отверстий, чтобы обеспечить межслойное соединение. Этот последний факт не является большим сюрпризом, учитывая, насколько сильно NVIDIA любит использовать огромное число винтов в картах RTX Founders Edition. По словам компании, такое большое число транзисторов на одной плате ещё никогда не размещалось.

В анонсе NVIDIA Ampere также появилась новая архитектура «MIG» или мультичиповые графические процессоры для «более гибких вычислений на GPU». После использования несколько напряженной аналогии с ракетами Хуанг объяснил, что MIG позволяет разделить графический процессор A100 на одиночный, как большинство карт используют сейчас, или на 7 экземпляров для изолированных приложений или отдельный пользователей. Что касается центров обработки данных, то здесь подразумевается, что теперь можно продавать доступ к вычислениям с меньшими затратами, ограничивая пространство для пользователей, которым не требуется такая большая мощность. Говоря простым языком, можно продать 6 экземпляров крупной компании, занимающейся искусственным интеллектом, а один экземпляр студенту университета, например, и они все будут работать на одной плате А100, не мешая друг другу.

Для тех людей из нашей аудитории, которые могут сделать что-либо с помощью искусственного интеллекта, глубокого обучения или машинного обучения, мы рассмотрим статистику, представленную NVIDIA:
На слайде о производительности были данные о пиковой производительности, но большинство пиков были близки к устойчивому среднему значению, и пока не понятно к чему это. Что касается приведенных цифр, NVIDIA утверждает, что производительность с двойной точностью A100 FP64 составляет 20 TFLOP против 8 TFLOP на V100 Volta с FP64. Если принять тот же подход к измерению, это, очевидно, большой скачок, но как это отразится на реальной производительности, будет зависеть от используемого приложения. В играх, конечно, нет линейного перевода TFLOPS в FPS или количество кадров, поэтому говорить про игровую производительность не приходится. Производительность Tensor Float была указана как 16 TFLOP на V100 с FP32, 160TFLOP на A100, производительность разреженной оптимизации данных достигла пика 310 TFLOP для FP32 tensor float. NVIDIA отдельно отметила, что большинство людей используют FP32 для своей работы в этом пространстве, поэтому основное внимание именно уделяется FP32, не FP16. О производительности INT8 NVIDIA заявляет, что A100 - это «первый процессор, превысивший 1 петафлоп», конкретизируя, что производительность достигает 1250 TFLOP.

NVIDIA использовала демонстрацию распознавания речи, идентифицирующую птиц на основе издаваемых звуков, в первую очередь используя это в качестве примера того, как происходит обработка данных при разделении либо объединении на платы A100. Учитывая, что все 7 MIG работают как один графический процессор, NVIDIA отмечала производительность в 500 запросов в секунду, тогда как Volta обеспечивала только 80.

DGX

Следующим крупным объявлением был DGX, мини-суперкомпьютер NVIDIA, который продается бизнес-клиентам.

Новое решение NVIDIA DGX A100 - это третье поколение линейки DGX, и NVIDIA утверждает, что оно было оптимизировано для «глубокого обучения, анализа данных и их вывода». Поскольку DGX имеет 8 графических процессоров NVIDIA A100, его можно использовать для одновременной работы до 56 пользователей или же напрямую использовать 8 графических процессоров. Машина имеет 9 межкомпонентных соединений Mellanox CX6, каждое из которых имеет скорость 200 Гбит/с. Mellanox - это компания, которую NVIDIA недавно приобрела, поэтому эта интеграция была предсказуема. Что касается центральных процессоров, то NVIDIA использовала 64-ядерные процессоры AMD Epyc Rome, в частности, два процессора Rome, что дает 128 ядер для каждого блока DGX, а также 1 ТБ оперативной памяти.

Новый NVLink также имеет скорость 600 ГБ/с, но мы должны отметить, что эта реализация явно отличается от NVLink на игровых картах. Существует более медленная, урезанная версия для игровых карт, ведь используемое здесь решение с пропускной способностью 600 ГБ/с намного дороже и нацелено на гораздо более высокую рабочую нагрузку, чем в играх с несколькими GPU-приложениями. Скорее всего, мы не увидим мост NVLink 600 Гбит/с на потребительских картах.

Также в новом DGX установлено 15 ТБ накопителя PCIe Gen4 NVMe SSD и 4,8 ТБ/с пропускной способности в двух направлениях.

Новый DGX будет стоить 199 000 долларов, что делает его сравнительно дешевым по сравнению с предыдущими решениями DGX, учитывая его вычислительные возможности. Если разочаровались, купив RTX 2080 незадолго до запуска 2070 Super, представьте себе, что вы покупаете мини-суперкомпьютер за 400 000 долларов, а новая улучшенная версия стоит - 200 000 долларов.

Все эти достижения заслуживают внимания для целевой аудитории, и одно из наиболее заметных отличий для всех, кто заинтересован в сокращении площади дата-центров, заключается в значительном сокращении пространства, необходимого для центров обработки данных с высокопроизводительными компьютерами. Конечно, при снижении стоимости более вероятным конечным результатом будет то, что разработчики либо будут запускать менее оптимизированный код на более мощном оборудовании, либо просто найдут для него другие варианты использования. 

NVIDIA привела пример 25-стоечного центра обработки данных AI по цене 11 миллионов долларов США, для работы которого требуется 630 кВт, отметив, что в нем было 50 систем DGX-1 для обучения и 600 систем ЦП для вывода данных. Имейте в виду, что это оригинальный DGX, за два поколения назад от этого. Новейшее решение DGX A100 будет развертываться за 1 миллион долларов США, а на 1 стойку требуется по 28 кВт, с существенным сокращением занимаемого пространства.

NVIDIA Edge AI

NVIDIA также анонсировала свое решение NVIDIA EGX A100, которое, похоже, уделяет большое внимание безопасности и аутентифицированным загрузочным решениям для IOT.

EGX имеет сетевое решение Mellanox ConnectX 6, смонтированное прямо на плате, и обеспечивающее скорость до 100 Гбит/с. NVIDIA отметила, что фокусируется на совершенствовании автоматизации и обучения, и подчеркнула партнерство с BMW и EGX. NVIDIA утверждает, что BMW выпускает 40 моделей автомобилей в 100 вариантах каждый день, импортирует 30 миллионов единиц компонентов от 2000 поставщиков и отправляет их на 30 заводов по всему миру. Робототехника участвует во всем этом, и именно поэтому NVIDIA работает с BMW над подготовкой будущих систем робототехники для автоматизации и ускорения производства.

Комментарии (0)
Добавить комментарий
Прокомментировать
  • NVIDIA DGX A100 - замечена суперкомпьютерная система на базе процессора Ampere GA100 нового поколения
    По мере приближения к #NVIDIA #GTC 2020 «Get Amped» были обнаружены подробности о новом #DGX, работающем на ГП #Ampere следующего поколения. NVIDIA зарегистрировала на
    Видеокарты NVIDIA Ampere до 50% быстрее и вдвое эффективнее, чем Turing - анонс во 2-м полугодии 2020 года
    Как сообщают в Taipei Times, #GeForce следующего поколения на базе #Ampere будут намного быстрее и эффективнее графических карт на базе #Turing, а появление на рынке
    AMD Navi 21 Lite, Navi 22 и Navi 23, обнаруженные в патче для драйвера Linux, как ожидается, должны стать конкурентами NVIDIA Ampere
    Описание на грядущие графические процессоры серии #Navi 20, Navi 21 Lite, Navi 22 и Navi 23, появились в новых патчах для драйверов Linux, подтверждающих, что разработка
    Видеокарты NVIDIA Ampere выйдут в 2020 году
    Видеокарты NVIDIA на архитектуре Ampere, основанные на 7-нанометровом EUV техпроцессе Samsung, выйдут уже в 2020 году. #nvidia #ampere #samsung
    NVIDIA GeForce 2080 представят 12 апреля
    В интернете, на различных форумах появилась информация о том, что NVIDIA представит новое поколение видеокарт 12 апреля. Графические адаптеры будут построены на
    NVIDIA GeForce GTX 2000 не получит GPU Volta или Ampere
    Фуад Абазович из Fudzilla не раскрывая своих информаторов сообщил, что компания NVIDIA имеет два больших GPU, которые будут выпущены в 2018 году. Ранее мы уже слышали о
    лучший сайт где можно скачать шаблоны для dle 12.0 бесплатно