Samara Portal Technology, Computers

Самарский портал "Технологии, компьютеры"

NVIDIA представила самый передовой ускоритель для сверхмасштабируемых дата-центров из когда-либо созданных - NVIDIA® Tesla® P100. Новейшее решение для платформы ускоренных вычислений NVIDIA Tesla, Tesla P100 позволяет создавать новый класс серверов с производительностью уровня нескольких сотен классических серверов на базе CPU. Современные дата-центры — обширные сетевые инфраструктуры с многочисленными взаимосвязанными CPU-серверами — обрабатывают огромное количество транзакций, например, вэб-сервисов. Но их мощи недостаточно для нового поколения научных приложений и задач, связанных с искусственным интеллектом, для которых требуются сверхэффективные, ультраскоростные серверные узлы.

Ускоритель Tesla P100, основанный на новой архитектуре NVIDIA Pascal™ с пятью передовыми технологиями, обеспечивает несравненную производительность и экономичность для самых ресурсоемких приложений.

“Для решения самых актуальных научно-технических задач— поиска лекарств от рака, выявление причин изменения климата, создания умных машин— требуется колоссальная вычислительная мощь, - говорит Дженсен Хуанг (Jen-Hsun Huang), генеральный директор и соучредитель NVIDIA. – Архитектура Pascal была изначально создана, чтобы стать воплощением инноваций на каждом уровне. Это большой шаг вперед в скорости и эффективности вычислений, который поможет ярким талантам совершить новые прорывы”.

Д-р Джон Келли III (John Kelly III), старший вице-президент Cognitive Solutions и IBM Research, отмечает: “Искусственный интеллект и познание требуют абсолютно нового подхода и нового уровня вычислений. Графические процессоры NVIDIA соместно с технологией OpenPOWER уже ускоряют обучение Watson новым умениям. Связка из архитектуры Power от IBM и архитектуры Pascal от NVIDIA с интерфейсом NVLink вместе еще больше ускорит изучение процессов познания, ускорив развитие искусственного интеллекта”.

Пять архитектурных прорывов
Tesla P100 обеспечивает беспрецедентную производительность, масштабируемость и эффективность программирования благодаря использованию пяти прогрессивных технологий:

  • Архитектура NVIDIA Pascal для экспоненциального роста производительности –Tesla P100 на базе архитектуры Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе архитектуры прошлого поколения NVIDIA Maxwell™.
  • NVIDIA NVLink для максимальной масштабируемости приложений – NVIDIA NVLink™ , высокоскоростной интерфейс для связи между несколькими графическими процессорами, распределяет нагрузку между GPU, увеличивая пропускную способность в 5 раз по сравнению с лучшими на сегодня решениями в данном классе. NVLink позволяет связать до восьми GPU Tesla P100, максимально повышая производительность в узле. IBM уже внедрила NVLink в свои процессоры POWER8 для высокоскоростной коммуникации между CPU и GPU.
  • 16нм FinFET для высокой энергоэффективности – Обладая 15.3 млрд. транзисторов, построенных на базе 16нм процесса FinFET, графический процессор Pascal является крупнейшим в мире FinFET чипом.2 Он создан, чтобы обеспечить высочайшую производительность и энергоэффективность для нагрузок с практически неограниченными вычислительными требованиями.
  • CoWoS с HBM2 для больших нагрузок – архитектура Pascal объединяет процессор и данные в одном пакете, чтобы максимально повысить эффективность вычислений. Инновационный подход к строению памяти, Chip-on-Wafer-on-Substrate (CoWoS) с HBM2, повышает пропускную способность памяти в 3 раза, до 720ГБ/с, по сравнению с архитектурой Maxwell.
  • Новые алгоритмы искусственного интеллекта для пиковой производительности – новые инструкции половинной точности обеспечивают пиковую производительность свыше 21 терафлопса в задачах глубокого обучения.

Графический ускоритель Tesla P100 поднимает на новый уровень производительность в ряде приложений высокопроизводительных вычислений и глубокого обучения, включая приложение молекулярной динамики AMBER, которое работает быстрее на 1-ом серверном узле с графическими процессорами Tesla P100, чем на 48 двухсокетных серверных узлах. Для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU Tesla P100. А популярное приложение прогнозирования погоды COSMO работает быстрее на восьми GPU Tesla P100, чем на 27 двухсокетных серверах.

Tesla P100 - первый ускоритель со скоростью вычислений двойной и одинарной точности в 5 и 10 терафлопс соответственно – это огромный шаг вперед в скорости обработки данных и ускорении открытий в широком спектре областей.

Обновления в NVIDIA SDK
NVIDIA также анонсировала ряд обновлений в NVIDIA SDK, самой мощной в мире платформе разработки для GPU-вычислений.

В число обновлений входит NVIDIA CUDA® 8. Новейшая версия платформы параллельных вычислений NVIDIA представляет разработчикам прямой доступ к новым возможностям Pascal, включая унифицированную память и NVLink. Кроме того, в актуальный релиз входит библиотека анализа графов nvGRAPH, которую можно использовать для расчета траекторий, информационной безопасности и анализа логистики, что включает в сферу применения GPU-ускоренных вычислений аналитику Big Data.

NVIDIA также анонсировала cuDNN версии 5, GPU-ускоряемую библиотеку примитивов для сетей глубокого обучения. cuDNN 5 включает поддержку GPU Pascal, ускорение рекуррентных нейронных сетей, используемых для видео и других последовательных данных, а также ряд улучшений, предназначенных для использования в медицинской, нефтегазовой и других областях промышленности. cuDNN ускоряет работу ведущих фреймворков глубокого обучения, включая TensorFlow от Google, Caffe от Университета Беркли, Theano от Университета Монреаля и Torch от Нью-Йоркского Университета, которые, в свою очередь, находятся в основе решений от Amazon, Facebook, Google и других компаний.

Спецификации Tesla P100

  • Скорость вычислений двойной точности - 5.3 терафлопс, одинарной точности - 10.6 терафлопс и половинной точности - 21.2 терафлопс, с технологией NVIDIA GPU BOOST™
  • Двунаправленный интерфейс NVIDIA NVLink со скоростью 160ГБ/с
  • 16ГБ памяти CoWoS HBM2
  • Полоса пропускания 720ГБ/с памяти CoWoS HBM2
  • Улучшенная программируемость с движком перехода по страницам и унифицированной памятью
  • Защита ECC для повышенной надежности
  • Оптимизация под сервер для высокой пропускной способности и надежности дата-центра

Доступность

Графические ускорители NVIDIA Tesla P100 на базе Pascal появятся в составе новой системы глубокого обучения NVIDIA DGX-1™ в июне. Также ожидается, что новый процессор появится в составе серверов от ведущих производителей в начале 2017 года.

----

Цифровизация 2023: что это такое

Цифровизация 2023: что это такое. Статья Владислава Боярова. 09.03.2023 г.

Галопом по вычислительным Европам. Часть 6. Спецпроцессоры.

Галопом по вычислительным Европам. Часть 6. Спецпроцессоры. Часть 5. Память. Статья Ильи Вайцмана. 15.03.2023 г.

«Домашний компьютер». Конкурс в Самаре.

«Домашний компьютер». Конкурс в Самаре.

Blood, Sweat & Tears, или Кровь, пот и слёзы – часть третья, объединительная

ИТ-Перестройка-2023 от OCS

ИТ-Перестройка-2023 от OCS. Статья Владислава Боярова. 10.03.2023 г.