NVIDIA Tesla P100 ускоряет приложения глубокого обучения и высокопроизводительные вычисления

Опубликовано: 12.04.2016 13:46 | Автор: Пресс-релиз | Просмотров: 1684

NVIDIA представила самый передовой ускоритель для сверхмасштабируемых дата-центров из когда-либо созданных - NVIDIA® Tesla® P100. Новейшее решение для платформы ускоренных вычислений NVIDIA Tesla, Tesla P100 позволяет создавать новый класс серверов с производительностью уровня нескольких сотен классических серверов на базе CPU. Современные дата-центры — обширные сетевые инфраструктуры с многочисленными взаимосвязанными CPU-серверами — обрабатывают огромное количество транзакций, например, вэб-сервисов. Но их мощи недостаточно для нового поколения научных приложений и задач, связанных с искусственным интеллектом, для которых требуются сверхэффективные, ультраскоростные серверные узлы.

Ускоритель Tesla P100, основанный на новой архитектуре NVIDIA Pascal™ с пятью передовыми технологиями, обеспечивает несравненную производительность и экономичность для самых ресурсоемких приложений.

“Для решения самых актуальных научно-технических задач— поиска лекарств от рака, выявление причин изменения климата, создания умных машин— требуется колоссальная вычислительная мощь, - говорит Дженсен Хуанг (Jen-Hsun Huang), генеральный директор и соучредитель NVIDIA. – Архитектура Pascal была изначально создана, чтобы стать воплощением инноваций на каждом уровне. Это большой шаг вперед в скорости и эффективности вычислений, который поможет ярким талантам совершить новые прорывы”.

Д-р Джон Келли III (John Kelly III), старший вице-президент Cognitive Solutions и IBM Research, отмечает: “Искусственный интеллект и познание требуют абсолютно нового подхода и нового уровня вычислений. Графические процессоры NVIDIA соместно с технологией OpenPOWER уже ускоряют обучение Watson новым умениям. Связка из архитектуры Power от IBM и архитектуры Pascal от NVIDIA с интерфейсом NVLink вместе еще больше ускорит изучение процессов познания, ускорив развитие искусственного интеллекта”.

Пять архитектурных прорывов
Tesla P100 обеспечивает беспрецедентную производительность, масштабируемость и эффективность программирования благодаря использованию пяти прогрессивных технологий:

Архитектура NVIDIA Pascal для экспоненциального роста производительности –Tesla P100 на базе архитектуры Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе архитектуры прошлого поколения NVIDIA Maxwell™.
NVIDIA NVLink для максимальной масштабируемости приложений – NVIDIA NVLink™ , высокоскоростной интерфейс для связи между несколькими графическими процессорами, распределяет нагрузку между GPU, увеличивая пропускную способность в 5 раз по сравнению с лучшими на сегодня решениями в данном классе. NVLink позволяет связать до восьми GPU Tesla P100, максимально повышая производительность в узле. IBM уже внедрила NVLink в свои процессоры POWER8 для высокоскоростной коммуникации между CPU и GPU.
16нм FinFET для высокой энергоэффективности – Обладая 15.3 млрд. транзисторов, построенных на базе 16нм процесса FinFET, графический процессор Pascal является крупнейшим в мире FinFET чипом.² Он создан, чтобы обеспечить высочайшую производительность и энергоэффективность для нагрузок с практически неограниченными вычислительными требованиями.
CoWoS с HBM2 для больших нагрузок – архитектура Pascal объединяет процессор и данные в одном пакете, чтобы максимально повысить эффективность вычислений. Инновационный подход к строению памяти, Chip-on-Wafer-on-Substrate (CoWoS) с HBM2, повышает пропускную способность памяти в 3 раза, до 720ГБ/с, по сравнению с архитектурой Maxwell.
Новые алгоритмы искусственного интеллекта для пиковой производительности – новые инструкции половинной точности обеспечивают пиковую производительность свыше 21 терафлопса в задачах глубокого обучения.

Графический ускоритель Tesla P100 поднимает на новый уровень производительность в ряде приложений высокопроизводительных вычислений и глубокого обучения, включая приложение молекулярной динамики AMBER, которое работает быстрее на 1-ом серверном узле с графическими процессорами Tesla P100, чем на 48 двухсокетных серверных узлах. Для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU Tesla P100. А популярное приложение прогнозирования погоды COSMO работает быстрее на восьми GPU Tesla P100, чем на 27 двухсокетных серверах.

Tesla P100 - первый ускоритель со скоростью вычислений двойной и одинарной точности в 5 и 10 терафлопс соответственно – это огромный шаг вперед в скорости обработки данных и ускорении открытий в широком спектре областей.

Обновления в NVIDIA SDK
NVIDIA также анонсировала ряд обновлений в NVIDIA SDK, самой мощной в мире платформе разработки для GPU-вычислений.

В число обновлений входит NVIDIA CUDA® 8. Новейшая версия платформы параллельных вычислений NVIDIA представляет разработчикам прямой доступ к новым возможностям Pascal, включая унифицированную память и NVLink. Кроме того, в актуальный релиз входит библиотека анализа графов nvGRAPH, которую можно использовать для расчета траекторий, информационной безопасности и анализа логистики, что включает в сферу применения GPU-ускоренных вычислений аналитику Big Data.

NVIDIA также анонсировала cuDNN версии 5, GPU-ускоряемую библиотеку примитивов для сетей глубокого обучения. cuDNN 5 включает поддержку GPU Pascal, ускорение рекуррентных нейронных сетей, используемых для видео и других последовательных данных, а также ряд улучшений, предназначенных для использования в медицинской, нефтегазовой и других областях промышленности. cuDNN ускоряет работу ведущих фреймворков глубокого обучения, включая TensorFlow от Google, Caffe от Университета Беркли, Theano от Университета Монреаля и Torch от Нью-Йоркского Университета, которые, в свою очередь, находятся в основе решений от Amazon, Facebook, Google и других компаний.

Спецификации Tesla P100

Скорость вычислений двойной точности - 5.3 терафлопс, одинарной точности - 10.6 терафлопс и половинной точности - 21.2 терафлопс, с технологией NVIDIA GPU BOOST™
Двунаправленный интерфейс NVIDIA NVLink со скоростью 160ГБ/с
16ГБ памяти CoWoS HBM2
Полоса пропускания 720ГБ/с памяти CoWoS HBM2
Улучшенная программируемость с движком перехода по страницам и унифицированной памятью
Защита ECC для повышенной надежности
Оптимизация под сервер для высокой пропускной способности и надежности дата-центра

Доступность

Графические ускорители NVIDIA Tesla P100 на базе Pascal появятся в составе новой системы глубокого обучения NVIDIA DGX-1™ в июне. Также ожидается, что новый процессор появится в составе серверов от ведущих производителей в начале 2017 года.