Как известно, изначально графический чип GK104 планировался как решение для видеокарт среднего сегмента, а верхний ценовой диапазон должны были представлять модели на GPU GK110. Однако чипы на архитектуре Kepler получились настолько удачными, что для конкуренции с самыми производительными видеокартами AMD вполне хватило возможностей GK104.
Первым продуктом, где данный графический чип будет применяться, станет профессиональная видеокарта TESLA K20, которую Nvidia представила на конференции GPU Technology. Её выпуск на рынок намечен на последний квартал года. Одновременно с ней компания продемонстрировала карту TESLA K10 на GK104. К10 фактически представляет собой двухчиповую видеокарту GTX 690, модифицированную для использования в профессиональных сферах деятельности и идущую в комплекте с соответствующим программным обеспечением. В ней компания обещает производительность 4,58 терафлоп в операциях над числами одинарной точности с плавающей точкой и пропускную способность памяти 320 Гбит/с, что на 20% больше, чем у видеокарты Radeon HD 7970.
О видеокарте К20 Nvidia сообщила следующую информацию: «К20 будет поддерживать технологию Hyper-Q и высокий уровень параллельных динамических вычислений. Графический чип GK110 войдёт в состав суперкомпьютера Titan в национальной лаборатории Oak Ridge в Теннеси и в состав системы Blue Waters в Национальном Центре Суперкомпьютерных Приложений в штате Иллинойс».
Hyper-Q создаёт очередь задач для приложений, использующих интерфейс прикладного программирования Message Passing Interface (MPI), выполняемых в гибридных CPU-GPU кластерах. Таким образом, может обрабатываться одновременно до 32 потоков MPI-данных (в Fermi только один). По словам разработчиков, производительность при операциях над числами двойной точности с плавающей точкой в К20 выросла в три раза по сравнению с видеокартами Tesla на архитектуре Fermi. Динамический параллелизм, в свою очередь, позволит увеличить загрузку ядер CUDA, позволяя им динамически обмениваться данными между собой для более рациональной их обработки, и делая тем самым графический чип более автономным и менее зависимым от центрального процессора.
Ниже приведены известные на настоящий момент спецификации GPU GK110:
- Число транзисторов 7,1 млрд.
- Число шейдерных процессоров 2880
- Число потоковых мультипроцессоров SMX – 15 с 192 шейдерными процессорами в каждом
- Шина памяти GDDR5 – 384 бит
- Силовые разъёмы 6- и 8-контактные
- Интерфейс PCI Express 3.0