NVIDIA Tesla P100 способен ускорить высокоскоростные вычисления и приложения глубокого обучения

0
318

NVIDIA анонсировала передовой ускоритель для сверхмасштабируемых дата-центров NVIDIA Tesla P100 в рамках конференции GTC. Tesla P100 позволяет создавать новый класс серверов с производительностью на уровне нескольких сотен классических CPU-серверов. Ускоритель основан на новой архитектуре NVIDIA Pascal с пятью передовыми технологиями и обеспечивает высокую производительность и экономичность для особо ресурсоёмких приложений.

Графический ускоритель Tesla P100 способен значительно повысить производительность в ряде приложений высокопроизводительных вычислений и глубокого обучения, в числе которых приложение молекулярной динамики AMBER, работающее на одном серверном узле с графическими процессорами Tesla P100 быстрее, чем на 48 двухсокетных узлах.

«Для решения самых актуальных научно-технических задач — поиска лекарства от рака, выявления причин изменения климата, создания умных машин — требуется колоссальная вычислительная мощь, — говорит Дженсен Хуанг, генеральный директор и соучредитель NVIDIA. — Архитектура Pascal была изначально создана, чтобы стать воплощением инноваций на каждом уровне. Это большой шаг вперёд в скорости и эффективности вычислений, который поможет ярким талантам совершить новые прорывы».

Обучение глубокой нейронной сети AlexNet, к примеру, требует 250 двухсокетных серверных узлов для достижения производительности восьми GPU Tesla P100. Популярное же приложение прогнозирования погоды COSMO работает быстрее на восьми GPU Tesla P100, чем на 27 двухсокетных серверах.

«Искусственный интеллект и познание требуют абсолютно нового подхода и нового уровня вычислений, — отмечает доктор Джон Келли III, старший вице-президент Cognitive Solutions и IBM Research. — Графические процессоры NVIDIA совместно с технологией OpenPOWER уже ускоряют обучение Watson новым умениям. Связка из архитектуры Power от IBM и архитектуры Pascal от NVIDIA с интерфейсом NVLink вместе еще больше ускорит изучение процессов познания, ускорив развитие искусственного интеллекта».

Как уже говорилось выше, NVIDIA Tesla P100 обеспечивает высокую производительность, масштабируемость и эффективность программирования благодаря использованию пяти прогрессивных технологий:

  • архитектура NVIDIA Pascal для экспоненциального роста производительности;
  • высокоскоростной интерфейс NVIDIA NVLink для максимальной масштабируемости приложений;
  • 15,3 миллиарда транзисторов на базе процесса 16 нм FinFET для высокой энергоэффективности;
  • CoWoS с HBM2 для больших нагрузок (повышение пропускной способности памяти до 720 ГБ/с);
  • новые алгоритмы искусственного интеллекта для пиковой производительности свыше 21 терафлопса.

NVIDIA Tesla P100 станет первым ускорителем со скоростью вычислений двойной и одинарной точности в 5 и 10 терафлопс соответственно. По заверениям производителя, это станет огромным шагом вперёд в скорости обработки данных и ускорении открытий в широком спектре областей.

Технические характеристики NVIDIA Tesla P100:

  • скорость вычислений двойной точности — 5,3 терафлопс, одинарной точности — 10,6 терафлопс и половинной точности — 21,2 терафлопс с технологией NVIDIA GPU BOOST;
  • двунаправленный интерфейс NVIDIA NVLimk со скоростью 160 ГБ/с;
  • 16 ГБ памяти CoWoS HBM2;
  • полоса пропускания 720 ГБ/с CoWoS HBM2;
  • улучшенная программируемость с движком перехода по страницам и унифицированной памятью;
  • защита ECC для повышенной надёжности;
  • оптимизация под сервер для высокой пропускной способности и надёжности дата-центра.

Кроме того, в ходе конференции NVIDIA анонсировала ряд обновлений в платформе разработки для GPU-вычислений NVIDIA SDK. В число обновлений входит новая версия платформы параллельных вычислений NVIDIA CUDA 8, библиотека анализа графов nvGRAPH для расчёта траекторий, информационной безопасности и анализа логистики, что включает в сферу применения GPU-ускоренных вычислений аналитику Big Data.

NVIDIA также рассказала о GPU-ускоряемой библиотеке примитивов cuDNN версии 5 для сетей глубокого обучения. Библиотека cuDNN ускоряет работу ведущих фреймворков глубокого обучения, в числе которых TensorFlow от Google, Caffe от университета Беркли, Theano от Университета Монреаля и Torch от Нью-Йоркского Университета, которые, в свою очередь, созданы на основе решений от Amazon, Facebook, Google и других компаний.

Графические ускорители на базе Pascal появятся в составе новой системы глубокого обучения NVIDIA DGX-1 в июне. Ожидается, что новый процессор также дебютирует в составе серверов от ведущих производителей к началу 2017 года.

Источник: 4pda.ru

No votes yet.
Please wait...

ОСТАВЬТЕ ОТВЕТ