Испытывавшая несколько лет назад большие затруднения платформа Intel Larrabee в настоящее время превратилась в весьма успешные карты для высокопроизводительных вычислений под брендом Xeon Phi. Особо ценно достижение Intel в свете того, что до неё подобный подход к вычислениям пытались применить Nvidia и AMD, однако недостаток гетерогенного программного обеспечения не давал развернуться их моделям устройств.
Intel удалось продвинуться за счёт своего преимущества в виде широкой совместимости своих карт с кодом под архитектуру х86. Это даёт возможность создавать приложения, аналогичные используемым на процессорах Intel Xeon, или сокращать время (и финансовые расходы) на перенос программ с Xeon на Xeon Phi. Одними из первых плодов подобной гибкости стало решение использовать 48 тысяч ускорителей Knights Corner в составе самого производительного суперкомпьютера мира Tianhe 2, производительность которого в будущем году достигнет 100 PFLOPS. Ускорители используются также в составе ряда других суперкомпьютеров, включая принадлежащий NASA.
Естественно, воодушевившись первоначальными успехами, в Intel и не думают останавливаться на достигнутом, готовясь в 2015 году внести в новое поколение Xeon Phi множество усовершенствований. Будущие Knights Landing можно назвать обычным центральным процессором, способным загружать операционную систему, подключаться к портам ввода/вывода, и так далее. Каждый из них будет поддерживать 6-канальную память DDR4-2400 в объёме 384 Гб на сокет против 16 Гб в нынешних Xeon Phi.
Хотя будет утрачена поддержка памяти GDDR5, компенсировать эту потерю призвана 3D память объёмом до 16 Гб с пропускной способностью 500 Гб/с (полуторакратный рост) с низкими задержками (ниже, чем в Nvidia Tesla K40 и AMD R9 290X). В зависимости от задачи эта память может функционировать либо как кеш, либо в качестве основной; или же можно сочетать оба сценария, выделив 4 Гб под кеш и оставшиеся 12 Гб сделав адресуемым пространством памяти. Также будут присутствовать 36 линий PCIe v3 для соединений HPC, внешний GPU или дополнительный сопроцессор Knights Landing, порты ввода / вывода и т.д. Будут использоваться 72 вычислительных ядра на архитектуре Atom Silvermont с поддержкой набора инструкций AVX-512.
Нас ожидает 2-кратный рост производительности: 6 TFLOP в операциях одинарной точности над числами с плавающей запятой и 3 TFLOP при вычислениях двойной точности. Также будут выпущены отдельные разновидности под названием Knights Landing-F, куда войдут 2-канальные контроллеры Cray HPC с производительностью 100 Гбит/с, с 32 линиями PCIe v3. В конце 2015 года будут представлены ещё и карты с интерфейсом PCIe с качестве сопроцессоров для чипов Xeon, с поддержкой до 64 Гб памяти.