Samara Portal Technology, Computers

Самарский портал "Технологии, компьютеры"

NVIDIA представила самый передовой ускоритель для сверхмасштабируемых дата-центров из когда-либо созданных - NVIDIA® Tesla® P100. Новейшее решение для платформы ускоренных вычислений NVIDIA Tesla, Tesla P100 позволяет создавать новый класс серверов с производительностью уровня нескольких сотен классических серверов на базе CPU. Современные дата-центры — обширные сетевые инфраструктуры с многочисленными взаимосвязанными CPU-серверами — обрабатывают огромное количество транзакций, например, вэб-сервисов. Но их мощи недостаточно для нового поколения научных приложений и задач, связанных с искусственным интеллектом, для которых требуются сверхэффективные, ультраскоростные серверные узлы.

Ускоритель Tesla P100, основанный на новой архитектуре NVIDIA Pascal™ с пятью передовыми технологиями, обеспечивает несравненную производительность и экономичность для самых ресурсоемких приложений.

“Для решения самых актуальных научно-технических задач— поиска лекарств от рака, выявление причин изменения климата, создания умных машин— требуется колоссальная вычислительная мощь, - говорит Дженсен Хуанг (Jen-Hsun Huang), генеральный директор и соучредитель NVIDIA. – Архитектура Pascal была изначально создана, чтобы стать воплощением инноваций на каждом уровне. Это большой шаг вперед в скорости и эффективности вычислений, который поможет ярким талантам совершить новые прорывы”.

Д-р Джон Келли III (John Kelly III), старший вице-президент Cognitive Solutions и IBM Research, отмечает: “Искусственный интеллект и познание требуют абсолютно нового подхода и нового уровня вычислений. Графические процессоры NVIDIA соместно с технологией OpenPOWER уже ускоряют обучение Watson новым умениям. Связка из архитектуры Power от IBM и архитектуры Pascal от NVIDIA с интерфейсом NVLink вместе еще больше ускорит изучение процессов познания, ускорив развитие искусственного интеллекта”.

Пять архитектурных прорывов
Tesla P100 обеспечивает беспрецедентную производительность, масштабируемость и эффективность программирования благодаря использованию пяти прогрессивных технологий:

  • Архитектура NVIDIA Pascal для экспоненциального роста производительности –Tesla P100 на базе архитектуры Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе архитектуры прошлого поколения NVIDIA Maxwell™.
  • NVIDIA NVLink для максимальной масштабируемости приложений – NVIDIA NVLink™ , высокоскоростной интерфейс для связи между несколькими графическими процессорами, распределяет нагрузку между GPU, увеличивая пропускную способность в 5 раз по сравнению с лучшими на сегодня решениями в данном классе. NVLink позволяет связать до восьми GPU Tesla P100, максимально повышая производительность в узле. IBM уже внедрила NVLink в свои процессоры POWER8 для высокоскоростной коммуникации между CPU и GPU.
  • 16нм FinFET для высокой энергоэффективности – Обладая 15.3 млрд. транзисторов, построенных на базе 16нм процесса FinFET, графический процессор Pascal является крупнейшим в мире FinFET чипом.2 Он создан, чтобы обеспечить высочайшую производительность и энергоэффективность для нагрузок с практически неограниченными вычислительными требованиями.
  • CoWoS с HBM2 для больших нагрузок – архитектура Pascal объединяет процессор и данные в одном пакете, чтобы максимально повысить эффективность вычислений. Инновационный подход к строению памяти, Chip-on-Wafer-on-Substrate (CoWoS) с HBM2, повышает пропускную способность памяти в 3 раза, до 720ГБ/с, по сравнению с архитектурой Maxwell.
  • Новые алгоритмы искусственного интеллекта для пиковой производительности – новые инструкции половинной точности обеспечивают пиковую производительность свыше 21 терафлопса в задачах глубокого обучения.

Графический ускоритель Tesla P100 поднимает на новый уровень производительность в ряде приложений высокопроизводительных вычислений и глубокого обучения, включая приложение молекулярной динамики AMBER, которое работает быстрее на 1-ом серверном узле с графическими процессорами Tesla P100, чем на 48 двухсокетных серверных узлах. Для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU Tesla P100. А популярное приложение прогнозирования погоды COSMO работает быстрее на восьми GPU Tesla P100, чем на 27 двухсокетных серверах.

Tesla P100 - первый ускоритель со скоростью вычислений двойной и одинарной точности в 5 и 10 терафлопс соответственно – это огромный шаг вперед в скорости обработки данных и ускорении открытий в широком спектре областей.

Обновления в NVIDIA SDK
NVIDIA также анонсировала ряд обновлений в NVIDIA SDK, самой мощной в мире платформе разработки для GPU-вычислений.

В число обновлений входит NVIDIA CUDA® 8. Новейшая версия платформы параллельных вычислений NVIDIA представляет разработчикам прямой доступ к новым возможностям Pascal, включая унифицированную память и NVLink. Кроме того, в актуальный релиз входит библиотека анализа графов nvGRAPH, которую можно использовать для расчета траекторий, информационной безопасности и анализа логистики, что включает в сферу применения GPU-ускоренных вычислений аналитику Big Data.

NVIDIA также анонсировала cuDNN версии 5, GPU-ускоряемую библиотеку примитивов для сетей глубокого обучения. cuDNN 5 включает поддержку GPU Pascal, ускорение рекуррентных нейронных сетей, используемых для видео и других последовательных данных, а также ряд улучшений, предназначенных для использования в медицинской, нефтегазовой и других областях промышленности. cuDNN ускоряет работу ведущих фреймворков глубокого обучения, включая TensorFlow от Google, Caffe от Университета Беркли, Theano от Университета Монреаля и Torch от Нью-Йоркского Университета, которые, в свою очередь, находятся в основе решений от Amazon, Facebook, Google и других компаний.

Спецификации Tesla P100

  • Скорость вычислений двойной точности - 5.3 терафлопс, одинарной точности - 10.6 терафлопс и половинной точности - 21.2 терафлопс, с технологией NVIDIA GPU BOOST™
  • Двунаправленный интерфейс NVIDIA NVLink со скоростью 160ГБ/с
  • 16ГБ памяти CoWoS HBM2
  • Полоса пропускания 720ГБ/с памяти CoWoS HBM2
  • Улучшенная программируемость с движком перехода по страницам и унифицированной памятью
  • Защита ECC для повышенной надежности
  • Оптимизация под сервер для высокой пропускной способности и надежности дата-центра

Доступность

Графические ускорители NVIDIA Tesla P100 на базе Pascal появятся в составе новой системы глубокого обучения NVIDIA DGX-1™ в июне. Также ожидается, что новый процессор появится в составе серверов от ведущих производителей в начале 2017 года.

О выборе компьютера

О выборе компьютера. Статья Владислава Боярова

Intel: архитектурные неизлишества… с хвостиком

Intel: архитектурные неизлишества… с хвостиком. Статья Владислава Боярова