News

Nvidia GeForce GTX 750 TI

W dniu dzisiejszym pierwsze karty z rdzeniem Maxwell wędrują na sklepowe. Nvidia poszła nieco w inną stronę niż tradycyjnie to robi, prezentując najpierw układy ze średniego segmentu. Patrząc na to od strony biznesowej jest to całkiem logiczne rozwiązanie – w końcu niewiele sensu miałoby wypuszczenie high endu w 28 nm, w sytuacji, gdy konkurencja nie ma żadnej odpowiedzi na GTX 780 Ti. Nvidia GeForce GTX 750 TI ma jednak w zanadrzu coś więcej niż tylko bycie "wypełniaczem" w ofercie firmy z Santa Clara. Czy mamy do czynienia z małą rewolucją? Sprawdźcie sami.

Jest Kepler, będzie Maxwell

Gdy w 2012 roku zadebiutowała pierwsza karta wyposażona w rdzeń Kepler, wiadomym było, że Nvidia rozpoczęła zmiany w architekturze mające na celu eliminację jednej z większych bolączek GeForce'ów – zbyt wysokiego poboru energii. Kepler nie był jednak jeszcze tym, co miało przynieść przełom, a jedynie wstępem do zmian, które widać w Maxwellu. Ten ostatni został zaprojektowany z myślą o jak najlepszym stosunku wydajności na wat. Nie powinno więc specjalnie dziwić, że pierwszymi układami, które pojawiają się na rynku są karty ze średniej półki (pomijając oczywiście to, że Nvidia musiała zapełnić ten segment nowymi produktami). Z tego też względu zieloni określili rdzeń GM107 jako układ zaprojektowany dla urządzeń charakteryzujących się małym limitem poboru mocy. Jak się później przekonacie, ma to spore przełożenie na samą budowę karty.

Porównanie wydajności GTX 750 Ti (Maxwell) i GTX 480 (Fermi)

Nvidia zwiększyła wydajność na wat wychodząc od koncepcji obranej przy Keplerze, ale udoskonalając ją. Co więcej, sama budowa rdzenia i bloków SM została przeprojektowana tak, by położyć nacisk na energooszczędność oraz mały rozmiar powierzchni rdzenia. Ulepszono masę rzeczy, by stworzyć lepszy balans przy obciążeniu, zoptymalizować scheduler oparty o kompilator, zwiększyć ilość instrukcji na cykl zegara i wiele innych rzeczy, które pozwoliły blokowi SM (SMM) z Maxwella zdecydowanie prześcignąć blok SM (SMX) z Keplera (choć nie pod względem czystej wydajności).

Rdzeń GM107 pozwala na użycie do pięciu bloków SMM, co jest dość dużym skokiem w porównaniu do dwóch z GK107. Co ważne, wielkość rdzenia wzrosła jedynie do 25%. W Maxwellu zieloni postanowili zdecydowanie zwiększyć ilość pamięci cache L2, która w przypadku testowanego przez nas GTX 750 Ti wynosi aż 2 MB, a wiec 8x więcej niż w Keplerze. Ma to przełożyć się na mniej odwołań do pamięci VRAM, a więc zwiększenia wydajności (GPU będzie szybciej "dożywiany" – nie występuje problem bootlenecka GPU przez pamięci). Jak twierdzi Nvidia, wszystkie te mniejsze lub większe usprawnienia przełożyły się na dwukrotny wzrost wydajności na wat względem Keplera.

Pełny schemat rdzenia GM107 (Maxwell)

Pełny rdzeń GM107 jak już pisaliśmy posiada pięć bloków SMM włączonych w jeden klaster GPC. W blokach SMM znajdują się m.in. silnik polimorficzny i jednostki teksturujące. Z SMM komunikuje się bezpośrednio jeden, wspólny dla wszystkich rasteryzer. ROP-y są nadal połączone z pamięcią cache L2 i kontrolerem pamięci – Nvidia wykorzystała dwa 64-bitowe kontrolery, co daje nam szynę o szerokości 128-bitów.

Przyglądając się bliżej blokowi SM możemy zauważyć kilka istotnych elementów. Każdy z nich zawiera cztery odseparowane od siebie bloki obliczeniowe z własnym buforem instrukcji, schedulerem i 32 rdzeniami CUDA. Każda para bloków korzysta wspólnie z czterech jednostek filtrowania tekstur oraz pamięci cache dla tych tekstur. Nvidia zaznacza, że pamięć L1 od teraz jest połączona z funkcją cache dla tekstur, przez co dzielona pamięć jest teraz dodatkową jednostką (podobnie było w pierwszym układzie korzystającym z CUDA – G80), która współpracuje ze wszystkim czterema blokami obliczeniowymi.

Blok SMM (Maxwell)

Pojedynczy blok SM jest słabszy od Keplera (oferuje "tylko" 90% jego wydajności), ale też jest od niego dużo mniejszy. Pozwala to na "upchnięcie" na małej powierzchni większej ich liczby, przez co sumarycznie Maxwell wychodzi na prowadzenie.

Nowością w Maxwellu jest implementacja sprzętowego dekodera wideo H.264 nazwanego NVENC. Co prawda ten pojawił się już w Keplerze (właśnie na nim oparta jest technologia ShadowPlay pozwalająca nagrywać filmy z rozgrywki), ale maxwellowski posiada liczne usprawnienia. Przede wszystkim ma być wydajniejszy w kodowaniu wideo, ale także aż 10X wydajniejszy w jego dekodowaniu. Zieloni postawili przy tym na bardzo niską prądożerność układu. W Maxwellu pojawi się profil GC5 stworzony z myślą o odtwarzaniu wideo lub innym, minimalnym wykorzystaniu mocy karty.

Jak widać GM107 prezentuje się całkiem ciekawie, choć też nie jakoś rewolucyjnie. Zieloni postawili na masę sprawdzonych przez nich samych patentów, cofając się nawet do czasów G80. Co ważne, jak sami się przekonacie za chwilę, GM107 jest naprawdę tak energooszczędny i posiada genialny stosunek wydajności na wat, jak zapewnia Nvidia.

Zgłoś błąd