Раскрыты характеристики следующего поколения GPU от NVIDIA
04.03.2020 218 0 yuk1o_n

Раскрыты характеристики следующего поколения GPU от NVIDIA

Hardware
В закладки

Видеокарты нового поколения от NVIDIA выйдут на рынок уже очень скоро, и, хотя конференция GTC была перенесена в онлайн трансляцию из-за коронавируса, это не мешает NVIDIA анонсировать свой самый мощный GPU на сегодняшний день. Несколько дней назад мы увидели утечку характеристик двух не выпущенных GPU, но похоже, что сегодня пользователем Twitter W_At_Ar_U был замечен новый чип - это чудовище, общее количество ядер которого почти достигает 8 тысяч.


Производительности и спецификации графических процессоров NVIDIA следующего поколения

Архитектура графического процессора NVIDIA следующего поколения, которая, как сообщается, носит кодовое название Ampere, известна уже давно. Она будет использоваться в новейших графических процессорах Tesla, которые будут использоваться крупнейшими организациями для работы с высокопроизводительными вычислениями и для облачных центров обработки данных.


По словам вице-президента по информационным технологиям и директора по IT главного Университета Индианы, который разворачивает этим летом свой суперкомпьютер Big Red, стало известно, что графические процессоры NVIDIA нового поколения обеспечивают массивный прирост производительности, до 75% по сравнению с существующими графическими процессорами на базе Volta. Также есть похожие отчеты, которые мы слышали в прошлом, о том, что GPU обеспечивают прирост производительности до 50% при вдвое более высокой эффективности, что было бы невероятным успехом.

Итак, что касается характеристик последнего графического процессора, который был обнаружен в Geekbench, мы также сравним его с ранее известными чипами, чтобы увидеть, какого повышения производительности нам следует ожидать от всех вариантов. Обратите внимание, что эти графические процессоры были протестированы еще в октябре и ноябре 2019 года, поэтому они находились в базе данных Geekbench уже несколько месяцев, но в спецификациях определенно произошли бы большие изменения, так как это все еще ранние образцы, и, так же следует отметить более низкие тактовые частоты, которые указывают на ранние прототипы, как уже упоминалось.

 

ГП NVIDIA следующего поколения #1 Характеристики и производительность

Первый ГП, о котором стоит поговорить - замеченный совсем недавно. В этом графическом процессоре общее количество мультипроцессоров составляет 124, что соответствует 7936 CUDA ядрам, поскольку профессиональная архитектура графических процессоров NVIDIA подразумевает 64 ядра CUDA для каждого потокового мультипроцессора. Это на 55% больше ядер CUDA по сравнению с Tesla V100 5120. Максимальная тактовая частота графического процессора составляет 1,1 ГГц, и на этих предварительных тактовых частотах он обеспечивает производительность на уровне 17,5–18 TFLOPS.
GPU имеет 32 ГБ памяти HBM2e с тактовой частотой 1200 МГц и работает через 4096-битный интерфейс шины.

В дополнение к характеристикам ядра и памяти, графический процессор имеет 32 МБ кэш-памяти второго уровня, что в 5,33 раза больше, чем у графического процессора Volta GV100, в котором, для сравнения, объем кэш-памяти второго уровня составляет всего 6 МБ. Учитывая огромный объем кеша, мы можем ожидать огромного повышения производительности и значительных архитектурных изменений в графическом процессоре NVIDIA следующего поколения, который разрабатывался годами. Что касается производительности, то GPU набрал 222377 баллов в тесте OpenCL (CUDA) на Geekbench 5. Платформа работает под управлением CUDA 8.0, и весьма вероятно, что на момент тестирования графический процессор не был полностью оптимизирован для нее. С учетом сказанного, характеристики этой карты выглядят буквально безумными, так что давайте продолжим.

 

ГП NVIDIA следующего поколения #2 Характеристики и производительность

Второй графический процессор имеет в общей сложности 118 мультипроцессоров или 7552 ядра CUDA. Это на 47,5% больше ядер CUDA по сравнению с Tesla V100 с его 5120 ядрами CUDA, упакованными в 80 мультипроцессоров, и общим объемом кэш-памяти L2 24 МБ. Этот графический процессор также работает на максимальной частоте 1,10 ГГц и имеет 24 ГБ памяти HBM2e, работающей по 3072-битной шине с тактовой частотой 1200 МГц. На этих скоростях этот чип должен обеспечивать общую теоретическую вычислительную мощность около 16,7 TFLOP, но, опять же, тактовые частоты определенно не выглядят окончательными и должны быть выше.

Этот конкретный графический процессор был протестирован в тестах OpenCL и CUDA Compute. В тесте OpenCL чип набрал 184096 баллов, а в тесте CUDA - 169368 баллов. Как и у предыдущего чипа, компоненты второго GPU работали на CUDA 8.0, что еще раз показывает, что эти графические процессоры еще не полностью оптимизированы для теста Geekbench 5, ведь существует огромная разница в баллах, несмотря на то, что разница в количестве ядер составляет всего 5%.

ГП NVIDIA следующего поколения #3 Характеристики и производительность

Наконец, у нас есть вариант с 108 мультипроцессорами или 6912 CUDA ядрами, который имеет тактовую частоту в 1,01 ГГц - самый медленный из всех трех GPU. У данного ускорителя на 35% больше ядер CUDA по сравнению с Tesla V100, а на борту 46,8 ГБ памяти HBM2e. Это может быть ошибкой из-за того, что тест Geekbench видит общую память, и на самом деле это может быть 48 ГБ, что имеет больше смысла. Этот GPU набирает 141654 балла в тесте Geekbench 5 (CUDA), что еще раз не является окончательным результатом из-за более низких тактовых частот.

Сравнение видеокарт NVIDIA Tesla

Название видеокарты Tesla

NVIDIA Tesla M2090

NVIDIA Tesla K40

NVIDIA Telsa K80

NVIDIA Tesla P100

NVIDIA Tesla V100

NVIDIA Tesla Next-Gen # 1

NVIDIA Tesla Next-Gen # 2

NVIDIA Tesla Next-Gen # 3

Архитектура графического процессора

Fermi

Kepler

Maxwell

Pascal

Volta

Ampere

Ampere

Ampere

Техпроцесс

40nm

28nm

28nm

16nm

12 нм

7nm?

7nm?

7nm?

Кодовое имя 

GF110

GK110

GK210 x 2

GP100

GV100

GA100?

GA100?

GA100?

Размер интегральной схемы

520mm2

561mm2

561mm2

610mm2

815mm2

Неизвестно

Неизвестно

Неизвестно

Количество транзисторов

3,00 млрд

7,08 млрд

7,08 млрд

15 млрд

21,1 млрд

Неизвестно

Неизвестно

Неизвестно

Количество CUDA ядер

512 СС (16 КС)

2880 СС (15 КС)

2496 CC (13 CU) x 2

3840 СС

5120 СС

6912 СС

7552 CC

7936 СС

Основные часы

650 МГц

875 МГц

875 МГц

1480 МГц

1455 МГц

1,08 ГГц (предварительно)

1,11 ГГц (предварительно)

1,11 ГГц (предварительно)

Производительность FP32

1,33 TFLOPs

4.29 TFLOPs

8,74 TFLOPs

10,6 TFLOPs

15.0 TFLOP

~ 15 TFLOP ( предварительно)

~ 17 TFLOP ( предварительно)

~ 18 TFLOP ( предварительно)

Производительность FP64 

0,66 TFLOPs

1.43 TFLOPs

2.91 TFLOPs

5.30 TFLOPs

7.50 TFLOP

Неизвестно

Неизвестно

Неизвестно

Объем VRAM

6 ГБ

12 ГБ

12 ГБ х 2

16  ГБ

16  ГБ

48 ГБ

24 ГБ

32 ГБ

Тип VRAM

GDDR5

GDDR5

GDDR5

HBM2

HBM2

HBM2e

HBM2e

HBM2e

Шина VRAM

384-битная

384-битная

384 битная х 2

4096-битная

4096-битная

4096-битная?

3072-битная?

4096-битная?

Скорость VRAM

3,7 ГГц

6 ГГц

5 ГГц

737 МГц

878 МГц

1200 МГц

1200 МГц

1200 МГц

Пропускная способность памяти

177,6 ГБ / с

288 ГБ / с

240 ГБ / с

720 ГБ / с

900 ГБ / с

1,2 ТБ / с?

1,2 ТБ / с?

1,2 ТБ / с?

Максимальный TDP

250W

300W

235W

300W

300W

Неизвестно

Неизвестно

Неизвестно

Интересно, однако, что последний графический процессор имеет больший объем памяти, что может означать две вещи: либо у NVIDIA будут слабые графические процессоры с более высоким объемом памяти для определенных рабочих задач, либо каждый графический процессор будет иметь разные конфигурации памяти, а HBM2e объемом 48 ГБ может быть самая высокая конфигурация памяти для этого конкретного GPU. Другая наиболее интересная вещь, которую вы можете заметить из этой утечки спецификаций, заключается в том, что, хотя линейка Tesla следующего поколения будет иметь различные вариации графических процессоров, самый производительный GPU должен определенно достичь максимума в 8192 ядра CUDA, упакованных в 128 мультипроцессоров.

 

Как и в случае с графическим процессором Volta GV100, полнофункциональный графический процессор следующего поколения может быть недоступен для широкой публики. В предыдущем интервью генеральный директор NVIDIA Дженсен Хуанг подтвердил, что большинство заказов на их 7-нм GPU следующего поколения будет обрабатываться TSMC, а небольшая часть будет отправлена в Samsung для производства.

Наконец, Дженсену был задан вопрос о сроках запуска их 7-нм графического процессора следующего поколения, но он просто ответил, что сейчас они не будут раскрывать какую-либо дату. Из недавнего интервью с финансовым директором NVIDIA, Колетт Кресс, мы знаем, что они хотят удивить всех своим анонсом 7-нм GPU, но они ждут подходящего времени для этого.


С другой стороны, AMD также, как ожидается, вскоре представит анонс своего  для высокопроизводительных вычислений - Radeon Instinct Mi100 на базе графического процессора Arcturus, который также, имеет 8192 ядер и основан на новейшей 7-нм архитектуре GPU. Однако, как доказала NVIDIA в прошлом, они могут оптимизировать свою архитектуру до такой степени, что она будет супер эффективной и конкурентоспособной по сравнению с графическими процессорами от своих конкурентов, которые основаны на более продвинутом техпроцессе(16 нм против 12 нм и 12 нм против 7 нм). Учитывая, что у NVIDIA и AMD будет паритет в техпроцессе с ее графическим процессором следующего поколения и с совершенно новой архитектурой, мы ожидаем увидеть действительно невероятную производительность. Мы ожидаем полномасштабного анонса NVIDIA на их официальном выступлении GTC 2020 22 марта.



Комментарии (0)
Добавить комментарий
Прокомментировать
  • Видеокарты NVIDIA Ampere до 50% быстрее и вдвое эффективнее, чем Turing - анонс во 2-м полугодии 2020 года
    Как сообщают в Taipei Times, #GeForce следующего поколения на базе #Ampere будут намного быстрее и эффективнее графических карт на базе #Turing, а появление на рынке
    Всё, что известно о графических процессорах Intel Xe для ПК и ноутбуков
    Архитектура #Intel #Xe будет построена с нуля командой, собранной Раджа Кодури. Первая архитектура #GPU Xe будет использоваться в мобильных видеокартах и настольных
    NVIDIA анонсировала ускоритель Tesla T4
    Компания NVIDIA представила графическую карту Quadro GeForce RTX и графические ускорители на GPU нового поколения Turing.
    Стали известны названия и дата выхода новых видеокарт от NVIDIA
    Благодаря слитым сертификационным документам компании NVIDIA, стали известны названия новых GPU и видеокарт нового поколения, а также дата старта продаж.
    Видеокарты NVIDIA Ampere появятся в апреле
    Соответствующие источники сообщают две ключевых новости. Плохая и хорошая.
    NVIDIA запретила использовать игровые видеокарты в дата-центрах
    Компания NVIDIA  добавила в пользовательское соглашение драйверов для игровых видеокарт пункт, запрещающий использование устройств серии GeForce GTX в центрах обработки
    лучший сайт где можно скачать шаблоны для dle 12.0 бесплатно